我正在学习使用TensorFlow教程的Word2Vec。我为Word2Vec运行的代码也来自TensorFlow教程:https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec_optimized.py。当我运行15个纪元的代码时,测试精度为30%左右。当我跑100个纪元时,测试精度达到了39%左右。我正在使用Text8数据集进行培训,并使用questions-words.txt进行评估。Word2Vec应该培养多少个时代?什么是推荐的训练数据集?
我是否需要跑更多的时代?我应该使用不同的数据集吗?我怎样才能提高测试的准确性?
谢谢!我会尝试一个更大的数据集。 –
较大的数据集的确提高了测试的准确性。还要感谢关于将数据集和测试与主题材料进行匹配的建议。 –