2015-10-15 23 views
1

我尝试了在线演示:http://www.alchemyapi.com/products/demo/alchemylanguage不拾取炼金术API演示正确的作者字段

我在您的博客文章之一粘贴:http://www.programmableweb.com/news/alchemyapi-updates-api-brings-deep-learning-to-masses/2013/07/25

对于由Alchemyapi我回的作者字段获得'Google+',而在博客文章中说它的作者是'Amy Castor'

为什么会出现这种情况?

btw。我最近发布了IBM dwanswers但发现他们被移动到计算器,因此交叉后

回答

1

Author Extraction documentation:

作者信息可以被嵌入到众多新闻文章或博客文章不同的方式,包括页面元数据,使用REL链接,纯文本等等。由于没有通过HTML标签(即标签)表达作者的标准方式,所以可靠地提取作者是一项复杂的任务。 AlchemyAPI并行使用了十几种技术来尝试查找作者,然后交叉引用结果以确定作者的最可能候选者。 AlchemyAPI使得作者抽取的难度很容易集成到您的应用程序中。

它认为作者在Google+上的原因是因为它出现在REL链接中。

在上面说的文章底部:

作者简介:艾米蓖麻跟我在Google+上

这个Google+专字链接https://plus.google.com/108856065353244179079?rel=author

的算法是捡这个?rel =作者参数,因此认为Google+是作者。

在很多情况下,这将是事实,但这是其中的一种情况 - 它就是认知计算的本质。