2013-03-28 75 views
0

我有一个文件列表。我有一个推文列表,其中被标记并词汇化为单词。python中的wordnet相似度计算

我要检查字之间的相似度在鸣叫和医疗文件所有话。我想检查推文中的单词与任何医学单词的距离有多近。

以上可以完成吗?请用一切可能的方法帮助我完成上述任务。

感谢

+0

http://en.wikipedia.org/wiki/Levenshtein_distance – 2013-03-28 02:45:43

+0

如何同音搜索。这里是一个关于activestate的实现(未经测试)http://code.activestate.com/recipes/52213-soundex-algorithm/ – 2013-03-28 02:46:54

+1

你有没有尝试过任何你自己呢?最好的stackoverflow问题是关于你尝试解决问题时遇到的具体问题。 – 2013-03-28 05:43:03

回答

1

由于您的术语是在医疗领域,你可能要考虑使用UMLS的。 UMLS ::相似性可以帮助您找到医学术语之间的相似性。 http://umls-similarity.sourceforge.net

祝你好运, 特德