2
我要寻找一个在Java的一个工具,允许我做以下事情:寻找同义词和倾斜词的基本形式
1)求倾斜字的基本形式。例如:
- 对于“连接”,“连接”,“连接”等字样,它将返回单词“连接”。
- 对于“运行”一词,“运行”它将返回单词“运行”。
2)为每个单词返回它的同义词集合。
有人知道这样的工具吗?
我要寻找一个在Java的一个工具,允许我做以下事情:寻找同义词和倾斜词的基本形式
1)求倾斜字的基本形式。例如:
2)为每个单词返回它的同义词集合。
有人知道这样的工具吗?
我假设你只关心英语。
您遇到的第一个问题叫做stemming。 SO post推荐使用Porter stemmer的Java实现。
WordNet有一个非常大的人类创建/策划的单词及其关系数据库,其中包括同义词等。这是一个Java API to WordNet。
这个Porter stemmer对于普通动词非常好,但对于V3动词却失败了。有没有一种工具可以完成成功的V3分析? – 2012-01-16 17:51:14
它也失败了其他动词,如暂停例如。 – 2012-01-16 17:54:37