2008-09-16 110 views
4

我想知道是否有任何良好的.NET推荐算法可用于开源项目,无论是否附加到搜索引擎。通过建议,我的意思是接受全文文章并基于关键字相似性从其索引中推荐其他文章。开源全文文章推荐引擎

在高端有像Autonomy这样的文档分类引擎;在低端垃圾邮件过滤器和博客“相关帖子”小部件。可能也是广告对文章的匹配。我想将其中一个纳入项目,但无法承受高端,而低端似乎都是基于LAMP的。

[对不起,一个答案要求澄清:我期待的是一个理想的独立库,但我愿意根据需要修改良好的源代码。最终的结果是我需要能够创建一个接受任意数量文本的C#服务,并返回一个类似的索引过的文章列表。基本上,这是StackOverflow本身在提交问题时所做的确切事情!]

谢谢! Steve

回答

0

问题并不十分清楚(算法或库?),但是唯一想到的就是Lucene.NET,它是在.Net框架中移植流行的Lucene库。 HTH。

1

我认为,在StackOverflow中,他们从文本中提取所有常见的英文单词,然后将这些单词与其他帖子的其余单词进行比较以获取“相关”帖子。