sentence-similarity

    0热度

    1回答

    我正在进行潜在语义分析,我试图从2个文档中获得相似度。我在Python上运行我的潜在语义分析代码,当我运行它时,我得到: Here are the singular values [ 0.7376057 0.4596623 0.25422212] Here are the first 3 columns of the U matrix [[ 0.98465137 -0.172792 -0.0

    0热度

    1回答

    我已经使用WS4J实现了句子相似性方法。 我已阅读关于基于两个句子中的词相似性的文章中的句子相似性。但我无法找到一种方法,根据单词的相似性计算并返回单个值作为整个句子相似度。 类似的问题在这个网站sentence-similarity-using-ws4j 要求在正如你可以看到我已经成功与WS4J高达凡在句子中的任何词发现在其他句子中的同义词集的匹配程度代码(匹配值大于0.9)返回一个匹配消息。但

    0热度

    1回答

    我有一个django后端(Postgre DB)。 假设一个给定的表,比如说A,有一个名为'message'的charfield。现在,我想要做的是找到A中与给定实例的“消息”字段具有相似“消息”的所有项目。相似性将基于某种算法。 TL; DR我想根据项目相似性找到项目。 的问题有三个部分: 我该怎么办呢?我可以实时做(慢)还是必须预先计算表A中所有项目之间的相似性(这可能会炸毁我的数据库) 如何

    5热度

    1回答

    我使用word2vec来表示一个小短语(3到4个字)作为一个独特的矢量,要么通过添加每个单词嵌入或通过计算字嵌入的平均值。 从我做过的实验中总会得到相同的余弦相似度。我怀疑它与word2vec生成的单词向量在训练之后是否与单位长度(欧几里得范数)相同?或者我在代码中有一个BUG,或者我错过了一些东西。 下面是代码: import numpy as np from nltk import Punk