2012-11-13 29 views
4

我在python中使用朴素贝叶斯分类器进行文本分类。是否有任何平滑方法来避免python NLTK中看不见的单词的零概率?提前致谢!在Python中平滑NLTK

回答

2

我建议用低(特别是1)频率替换所有单词到<unseen>,然后在这个数据中训练分类器。 对于分类,如果单词不在训练数据中,您应该查询<unseen>的模型。