1
NLTK Wordnet中的IC文件之间的主要区别是否有任何文档?Wordnet信息内容(IC)文件Python
具体来说,寻找brown_ic,semcor_ic,genesis_ic等之间的差异,所以我可以决定哪一个是最适合我的相似度努力字语料。
其他问题:完成所有上述相似的措施要求所有的单词在同一POS?
NLTK Wordnet中的IC文件之间的主要区别是否有任何文档?Wordnet信息内容(IC)文件Python
具体来说,寻找brown_ic,semcor_ic,genesis_ic等之间的差异,所以我可以决定哪一个是最适合我的相似度努力字语料。
其他问题:完成所有上述相似的措施要求所有的单词在同一POS?
我想你需要分别谷歌每个语料库。 http://www.nltk.org/nltk_data/的列表确实只给出了尺寸和许可证。
布朗语料库是1961年美国英语,事实与虚构的混合。见https://en.wikipedia.org/wiki/Brown_Corpus
semcor是布朗语料库的子集。
成因是根据http://nlpforhackers.io/corpora/圣经文本(这看起来对某些人有用的信息,太)
发现这里的brown_ic一些细节:https://stackoverflow.com/questions/18705778/what-is-在 - 使用 - 的棕语料库中-测量语义相似性为基础的上-wordne – Ksofiac