2017-05-04 51 views
0

我想要使用相似性(也许余弦)聚类一些句子,然后可能使用分类器将文本放入预定义的类。Word2vec分类和聚类tensorflow

我的想法是使用tensorflow生成嵌入词,然后为每个句子取平均值。接下来使用聚类/分类算法。

tensorflow是否提供准备使用word2vec生成算法?

一包文字模型会产生一个好的输出吗?

回答

1
  • 没有,tensorflow不提供准备使用的word2vec,但它确实有a tutorial on word2vec

  • ,字的包可产生令人惊奇的良好的输出,(但不是状态的最先进的)和具有可令人惊讶更快的益处。我有少量数据(成千上万的句子),并且分类的F1分数> 0.90。

+0

那么我发现Tensorflow没有准备好用于word2vec或手套。他们提供了一个用于实现word2vec模型的教程。我看了一下DL4J(JAVA),我想我现在要坚持下去。 – LonsomeHell