2012-06-18 20 views
0

我想创建一个自动同义词查找算法(主要用于品牌名称)。例如,如果用户输入单词“可口可乐”,我想返回单词“可乐”。同义词查找器文本挖掘算法

这可以很容易地使用dictoniaries来完成;但比我需要一个dictonary文件。 我如何自动创建一个? (我有一个有100万条记录的小语料库,同义词将来自这个)。

这个问题有没有文本挖掘算法? 此外,也有一些这方面的在线代名词服务,但这些不包含品牌名称:-(

感谢, krisy

+0

什么你的记录看起来像吗?你可以将你的记录集中在一起寻找类似的词条吗? –

回答

0

特里树基于算法可以找到同义词或相似的词。它不使用密钥,但位置在树中定义密钥,例如从A到B到B到C到C有很多数据结构,最简单的是一个邻接列表或一个三元搜索树

+0

你如何建议为“可口可乐”找到“可乐”将与尝试一起工作? ry单词/拼写错误的单词,但我不明白它们如何用于synonims :-( – krisy

+0

显示字母C下的第一个匹配的树? – Bytemain

+0

我担心会有太多的话返回:-( – krisy