2009-10-17 25 views
1

如果我有一组博客文章,例如我想过滤掉那些可能是关于我自己或与某些标准无关的关键字的专业领域是什么?我知道我可以列出要查找的单词列表(其中大部分是关于我自己或任何其他内容 - 组合不会结束),以便按照我的过滤条件执行操作,但这不是可扩展的策略。 levenschtein算法也会派上用场,但我认为这是整个研究领域?根据某些条件过滤掉文本内容,例如关于我自己

感谢

回答