我是nltk
的新手,我发现wordnet功能非常有用。它给出了synsets
,hypernyms
,等等。但是,它显然没有给出诸如'德里' - '海得拉巴'之类的位置之间的相似性,因为这些词不在词网语料库中。因此,我想知道,如果以某种方式,我可以更新字网络语料库,或者在不同的语料库上创建字词,例如,从维基百科中提取的与旅行相关的一组页面?如果我们可以根据不同的语料库创建wordnet,那么格式是什么,要采取相同的步骤,还有什么限制?wordnet在不同的文本?
请你指点我描述上述问题的链接。我搜索了互联网,Google搜索,阅读了nltk书的部分内容,但是我没有提及上述问题。
对不起,如果这个问题听起来完全荒谬。
Check about - DBpedia – RAVI