Word2vec是一个开源工具,用于计算Google提供的单词距离。可以通过输入单词并根据相似性输出排名单词列表来使用它。例如如何使用word2vec通过给出2个单词来计算相似距离
输入:
france
输出:
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
不过,我需要做的是通过给予2个字来计算相似距离。如果我给“法国”和“西班牙”,我怎么能得到0.678515的分数,而不用通过给出'法国'来阅读整个单词列表。
如果在这方面很有用,请参阅[这里](http://radimrehurek.com/gensim/models/word2vec.html)使用由原始word2vec c语言实现创建的矢量文件。 – matanster
@Satarupa Guha:这种相似性功能是什么?这是余弦吗? –
是的,这的确是余弦相似函数。 –