2011-07-19 54 views

回答

1

Lucene拥有各种语言的分析仪。当然,如果您知道每个文档所处的语言,那么这种方法才有效:给他们一个语言标记或使用language guesser

(不过,如果你想要做的流水线机器翻译跨语言检索,你对你自己的,我害怕。)

+0

感谢的语言猜测者的建议。我认为这对我的情况就足够了。 – Morrowless

+1

@Plelilune:介意你,语言猜测在文档上运行良好,但在短时间查询时可能会出错。对于查询,让用户选择语言(并且默认为“查找所有语言的文档”)可能是明智的选择。 –