2012-01-11 20 views
2

我要寻找一个在Java的一个工具,允许我做以下事情:寻找同义词和倾斜词的基本形式

1)求倾斜字的基本形式。例如:

  • 对于“连接”,“连接”,“连接”等字样,它将返回单词“连接”。
  • 对于“运行”一词,“运行”它将返回单词“运行”。

2)为每个单词返回它的同义词集合。

有人知道这样的工具吗?

回答

2

我假设你只关心英语。

您遇到的第一个问题叫做stemmingSO post推荐使用Porter stemmer的Java实现。

WordNet有一个非常大的人类创建/策划的单词及其关系数据库,其中包括同义词等。这是一个Java API to WordNet

+0

这个Porter stemmer对于普通动词非常好,但对于V3动词却失败了。有没有一种工具可以完成成功的V3分析? – 2012-01-16 17:51:14

+0

它也失败了其他动词,如暂停例如。 – 2012-01-16 17:54:37