2009-08-25 27 views
1

对于从孩子们采取输入的网站,我们需要过滤他们在网站(运行PHP)中输入他们的评论时使用的任何淘气/坏字。黑名单上的内容来过滤邮件

评论是一个免费的字段,用户可以输入他们想要的任何评论。我能想到的解决方案是有一个像 BLACKLIST的单词列表:坏,坏,字,woord,craap,craaaap,(我们可以填写所有黑名单)。

然后,当表单被保存时,我们可以查看列表,如果有任何单词存在,那么我们将不允许保存评论。

但该方法的prolem的是,他们可以通过添加字母的话,使其跳过过滤器EG得到解决:shiiiiit

让我知道你的想法是创建一些过滤器的最佳方式这些字。

+0

啊,clbuttic ... – MikeTheLiar 2013-01-31 22:25:59

回答

6

你永远无法过滤每一个排列。也许最可行的解决方案是过滤显而易见的,并实施“报告滥用”机制,以便有人可以手动查看(并拒绝)可疑评论。

5

因此,你会禁止狗屎,shït,shıt,śhit和śhiŧ?

黑名单在Unicode时代并不是一个可行的解决方案。然而,彻底禁止似乎过分。

-1

也总是有可能过滤像“低音”这样的词,当然包括不允许的单词之一。目前一些优秀的主持人似乎是解决这个问题的最佳解决方案。

+0

更成问题的是“屁股”在某些情况下只是猥亵。在其他情况下,这是一种动物的名字。 – troelskn 2009-08-25 11:00:28

4

如果你有足够的时间,值得阅读关于Scunthorpe problem

Jeff Atwood在the futility of obscenity filters也有帖子。

+0

这是一些很好的阅读,我特别喜欢最后一个:2008年6月,由美国家庭协会运行的一个新闻网站审查了美联社关于短跑运动员泰森盖伊的文章,用同性恋取代了“同性恋”的例子,从而使他的名字作为“泰森同性恋”。 – 2009-08-25 10:10:47

0

使用uClassify来训练不好的评论,当系统训练得足够好时,您可以标记出有问题的评论。