我有一些代码可以从我的数据集中删除停用词,因为停止列表似乎并没有删除我希望的大多数单词,我正在寻找将单词添加到这个停止列表,以便它将在这种情况下删除它们。 我使用去除停止词的代码是:添加单词到nltk stoplist
word_list2 = [w.strip() for w in word_list if w.strip() not in nltk.corpus.stopwords.words('english')]
我不能确定正确的语法用于添加的话,似乎无法在别处找到正确的一个。任何帮助表示赞赏。谢谢。
任何良好的英语停止字在那里编辑它? nltk一个似乎很差 – fabrizioM 2011-04-01 11:15:38
@fabrizioM http://fs1.position2.com/bm/txt/stopwords.txt这是我在我上次公司使用的名单.. – Rafi 2011-04-01 11:23:14
@Rafi这是一个比NLTK !谢谢! – 2015-09-18 23:36:16