我使用的word2vec_basic从https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/word2vec/word2vec_basic.py,我有几个(一般)问题。tensorflow word2vec:参数和预处理
如何确定num_steps
?在这个例子中它被设置为100001.
是一个skip_window
是5还是应该更大(10,25)?
此外,是否应将停用词和标点符号从训练数据集中删除,并且是否应将所有单词转换为小写?
谢谢。
@daria我更新了我的答案,根据我的学习,请检查是否有帮助。 – Harman