3

我想提取所有命名实体及其在Freebase转储中的类型。如何提取Freebase中所有实体的名称和类型?

我看了看 How to extract Freebase Data Dump for a particular topic 但我没有得到Freebase转储中的实际命名实体。

我'试图获得的信息是这样的, 名称:巴拉克奥巴马类型:人 名称:纽约类型:市等。

的游离碱已经在其数据库中的所有这些实体,但我没有找到任何Freebase API或Google API列出所有实体及其类型。

你能帮我吗。

谢谢

回答

3

数据转储格式描述here。自从我写出您提到的答案以来,情况有所改变,但基本原则仍然相同。

MQLreadSearch API可用于将Freebase主题过滤为特定类型(例如/ people/person类型)。主题可以有多种类型,但是如果你想要的是经典的NER类型,那么首先要做的事情可能是根据需要的类型进行过滤,因为在数千万个主题中只有300万人在Freebase中。

的游离碱包含的不仅仅是这将是在NER任务是有用的,所以你可能要退一步,想想你可能要提取以及其他什么性质的名字更多的信息。

+2

感谢您的回复。我正在寻找主题类别映射,最后能够使用WikiDump获得这样的映射。哪里可以得到每个维基百科标题的类别/类别。参考:http://wiki.dbpedia.org/Downloads39 –

+1

我不知道这DBpedia中你最后使用页上的文件,但同样的信息可从游离碱转储。 DBpedia和Freebase有不同的长处和短处,因此值得一看。 –

+1

我使用维基百科数据集实现查询分类,一开始我打算从freebase获取分类图,因为它有更多的数据集。最后我们决定使用wiki分类图。在dbpedia中,我使用了http://wiki.dbpedia.org/Downloads39#articles-categories和http://wiki.dbpedia.org/Downloads39#categories-skos文件。 –

相关问题