2012-01-19 28 views
0

自从早上我已经阅读了很多教程。我的问题涉及找到两个文件之间的相似性。我期待在java中使用LSA来达到这个目的。LSA - 找到SVD后的步骤

我明白术语 - 文档矩阵的创建,然后将SVD(维度得到降低)应用于它。 3矩阵是作为results.This听起来可能听起来很愚蠢,但我一直坚持了这一段时间。现在,如果我必须找到两个文件之间的相似性,我该怎么办?

+0

因为我只比较两个文档,使用LSA会有好处吗? – CTsiddharth

回答

0

使用SVD计算3个矩阵后,您需要计算要比较的两个文档的向量之间的相关性。你可以使用spearman的相关性。 另一种方法是使用余弦距离。

你会在LSA找到更多的细节,有一个完整的例子与解释。

您可能会搜索一些用于LSA的java库。

+0

嗨,我最近遇到此链接。 http://www.miislita.com/information-retrieval-tutorial/svd-lsi-tutorial-4-lsi-how-to-calculations.html。这种方法似乎很简单,完美地满足了我的目的 – CTsiddharth