2017-08-31 163 views
0

我已经获得了一个将单词映射到它们在python中的向量的字典,并且我正在试图散布绘制n个最相似的单词,因为TSNE上的大量单词正在永久存在。最好的选择是将字典转换为w2v对象来处理它。将Python字典转换为Word2Vec对象

+0

那么你到目前为止尝试过什么? – patrick

+0

单词向量从哪里来? (通常,任何提供它们的文件或者计算它们的库都已经将它们置于有用的形式中。)“Word2Vec对象”的具体含义是什么? – gojomo

+0

我用我自己的神经网络计算了词向量。 我试图想像他们像那个链接中的那个例子: https://www.kaggle.com/jeffd23/visualizing-word-vectors-with-t-sne –

回答

0

如果您已经使用自己的代码计算出了单词向量,那么您可能希望以与Google原始word2vec.c或gensim兼容的格式将它们写入文件。您可以查看KeyedVectors.save_word2vec_format()中的gensim代码,以确切了解它的向量是如何写入的 - 它少于20行代码 - 并执行类似于向量的操作。请参阅:

https://github.com/RaRe-Technologies/gensim/blob/3d2227d58b10d0493006a3d7e63b98d64e991e60/gensim/models/keyedvectors.py#L130

然后,你可以重新加载源自你的代码的载体,几乎直接与像one from Jeff Delaney you mention例子中使用它们。