的有效方式我有一个像巨大的字符串:蟒蛇 - 检查字符串的一部分是在列表
睡鼠的故事。曾几何时,有三个小姐姐;他们的名字是Elsie,Lacie和Tillie;和他们住在 的好.... BADWORD底部...
和我有大约400个不好的话列表:
bad_words = ["badword", "badword1", ....]
什么是检查最有效的方法如果文本包含badwords列表中的坏词?
我可以遍历文本和列表,如:
for word in huge_string:
for bw in bad_words_list:
if bw in word:
# print "bad word is inside text"...
但这似乎我是从90年代..
更新:不好的话是单个单词。
因此它可以是一个子或实际的话吗?如果单词使用集合。 –
@PadraicCunningham现在的实际单词 – doniyor
您是否尝试过'set intersection'? –