你们将如何着手在.Net平台上创建“实时”搜索引擎。近来对网络的实时搜索如今非常流行,我希望你们能帮我集思广益。我最终可能会尝试制作一些原型,但大多数情况下它只是一种“心理训练”。实时网页搜索(在.Net中)
的要求是:
- .NET平台,IIS,MS SQL服务器或Lucene.Net(文件系统)
- 输入数据进行索引仅仅是关键字加上一些元数据信息 - 没有进一步的处理所需
- 数据由关键词分组并通过关键字的出现次数进行排序
- 没有历史数据保持(数据比某一时间固定量被丢弃或移动到其他一些数据存储旧的)
不知道太多关于主题,这是我想出迄今:
数据通过Web服务送入系统。由于数据已经是关键字的形式,因此不会执行进一步的处理。 WS将数据保存到数据库。选择查询以固定的时间间隔执行以返回数据(例如:我们查询过去一小时的传入数据并每秒执行一次查询)。分组和排序在内存中执行以卸载sql服务器。 db中的旧数据每隔几分钟就会丢弃。 我不知道如果有很多新的行不断添加,sql服务器将如何处理。 然后显示分组和排序的数据。
我相信你们对这种事情有更多的经验和更好的想法。
问候,
的Ondrej
你能举出你认为可能类似的网站的例子吗? – 2009-11-08 05:09:07
我想到的网站是http://search.twitter.com/。我试图实现的功能是“趋势主题”。 – 2009-11-08 13:58:50