2017-02-13 24 views
1

我正在玩FastText,https://pypi.python.org/pypi/fasttext,它与Word2Vec非常相似。由于它似乎是一个相当新的图书馆,还没有建立很多功能。我想知道如何提取形态相似的单词,例如:model.similar_word(“dog”) - > dogs。但是没有内置函数。如何使用FastText查找类似的单词?

如果我键入model [“dog”],我只能得到向量,可能用于比较余弦相似度model.cosine_similarity(model [“dog”],model [“dogs”]]。使某种循环,然后在文本做对所有可能cosine_similarity这将需要一些时间..

回答

7

使用gensim,使用load.word2vec模型加载fastText训练好的.vec文件并使用most_similiar()方法找到相似的单词!

2

您应该使用gensim加载model.vec再拿到类似的话:

m = gensim.models.Word2Vec.load_word2vec_format('model.vec') 
m.most_similar(...) 
相关问题