11

我一直在学习了很多关于使用机器学习曲线通过观看克里斯托弗主教视频(http://videolectures.net/mlss04_bishop_gmvm/)。我觉得它非常有趣,并且观察了其他几个类别(机器学习/图表),但是想知道是否有人有更多学习方法的建议?关于在机器学习中使用图论的建议?

我的问题是,虽然影片给予了极大的高层次的理解,我没有在它更实用的技能呢。我读过关于机器学习/模式的主教书以及Norvig的AI书,但两者似乎都没有涉及具体使用图。随着搜索引擎和社交网络的出现,我认为机器学习在图表上会很受欢迎。

如果可能的话,任何人都可以建议的资源学习的榜样? (我是新来的这个领域和发展是我的一个爱好,所以我提前抱歉,如果有学习from..I尝试谷歌和大学网站超级明显的资源)。

在此先感谢!

回答

9

麦克阿瑟天才奖收件人和斯坦福大学达夫尼·科勒教授合作撰写了一份明确的教科书贝叶斯网络题为Probabalistic Graphical Models,其中包含了严格的介绍适用于AI图论。它可能不完全符合你的要求,但在它的领域,它是非常重视。

+0

只是添加到您的伟大的书籍推荐。作者(斯坦福大学教授)今年开始有一堂免费课程:http://www.pgm-class.org/ – Lostsoul

3

您可以在斯坦福大学参加免费在线课程机器学习和人工智能:

https://www.ai-class.com/
http://www.ml-class.org/

类不是简单地集中在图论,但包括该领域的更广泛的介绍和他们会给你一个关于如何以及何时应用哪种算法的好主意。我知道你已经阅读过关于AI和ML的入门书籍,但我认为在线课程会为你提供很多你可以尝试的练习。

15

首先,我会强烈建议书Social Network Analysis for Startups由马克西姆Tsvetovat和亚历山大KOUZNETSOV。像这样一本书是谁需要快速获得在特定学科基本流畅度(在这种情况下,图论),这样他们就可以开始编写代码来解决在这一领域问题的程序员一大福音。两位作者都是受过学术训练的图论者,但他们的书的目标读者是程序员。本书中提供的大量示例几乎都是使用networkx库的python。

其次,为您心目中的项目,种库是如果非常有帮助的不是不可缺少的:

  • 图分析:例如,优秀networkx(蟒蛇)或igraph (蟒,R,等人。)是我可以推荐的两个;和

  • 图形渲染:优秀graphViz,可用于 独立的命令行,但更可能你会想 使用它作为一个库;有在所有主要 语言的Graphviz绑定(例如,为Python有至少三个我知道的,虽然 是pygraphviz我的偏好;对于R有rgraphviz它是bioconductor包套件的 一部分)。 Rgraphviz具有优秀的文档(特别参见该软件包附带的Vignette)。

它是安装并开始使用这些库,特别是尝试使用它们

  • 学分析 的基本图论词汇和单位很容易(如度序列分布,节点遍历,图 运营商);

  • 区分图中的关键节点(例如,度中心性, 特征向量中心性,协调性);和

  • 以识别原型图子结构(例如,二分结构,三角形,周期,派系,集群,社区和核心)。

使用图形分析库快速理解图形理论的这些基本要素的值是在大多数情况下有一个1:刚才提到和概念之间1映射 (networkx或igraph)库中的函数。因此,例如,您可以快速生成两个尺寸相同(节点编号)的随机图,渲染然后查看它们,然后轻松地计算出例如平均程度序列或者介于两者和观察者之间的中心性第一手如何改变这些参数的值会影响图的结构。

W/r/t ML和图的组合理论技术,这里是我个人的有限经验。我在日常工作中使用ML,并且少用图论,但很少在一起使用。这只是一个限于我个人经验的经验观察,所以我没有发现在这两个领域中结合技术似乎很自然的问题。大多数图论理论分析在ML的盲点中是有用的,这是大量标记训练数据的可用性。 - 监督ML技术在很大程度上取决于这一点。

用于说明这一点的一类问题是在线欺诈检测/预测。收集数据(例如,归因于特定用户的在线交易集)几乎是不可能的,您可以合理确定地将其分离并标记为“欺诈性账户”。如果他们特别聪明和有效,那么你会错误标签为“合法”,并且对于那些涉嫌欺诈的账户,通常是第一级诊断(例如,,额外的身份验证或增加的等待期以换取现金)往往足以导致他们停止进一步的活动(这将允许进行明确的分类)。最后,即使你以某种方式设法收集合理无噪声的数据集来训练你的ML算法,它肯定会严重失衡(即比“欺诈”数据点更“合法”);这个问题可以通过统计预处理(重新采样)和算法调整(加权)来管理,但它仍然是一个问题,可能会降低结果的质量。

所以,虽然我从来没有能够成功地将ML技术用于这些类型的问题,但至少在两个实例中,我已经使用了图论,取得了一些成功 - 在最近的例子中,通过应用从卡内基梅隆一个小组的项目最初指向detection of online auction fraud on ebay

1

虽然这并不完全符合您的要求,但textgraphs是一个专注于图论与自然语言处理之间关系的研讨会。 Here是一个链接。我相信这个研讨会还产生了this这本书。