2012-07-05 41 views
0

我有一个高流量的新闻网站,我需要添加一个搜索功能。我需要一些免费或便宜的产品,可以立即为搜索结果添加新的新闻,处理高流量,并允许定制样式的结果。我看了一下谷歌自定义搜索,它似乎不是一个好的选择,因为你必须支付高流量,他们不会立即添加新的新闻文章,除非我支付每次添加文章时索引它们。索引和搜索内部页面文本的最佳解决方案?

有谁知道一个不同的搜索API,可以满足我的需求或更好的,我可以使用某种库或脚本?例如,Sphinx,Lucene,Solr等有能力为网页建立索引吗?如果是这样,这是否会有巨大的数据需求,这将使我的亚马逊网络服务的法案暴涨?什么是最好的解决方案?

+1

数据如何存储?一个数据库? – 2012-07-05 03:10:20

+0

文章的html存储在文本文件中,而不是数据库中。 – dallin

+1

ouch,被认为转向现代CMS? – 2012-07-05 03:57:48

回答

1

如果它们都只是一堆文本文件,则可以使用elasticsearchattachment plugin来索引这些文本文件。

但是,请注意,这不是即插即用的简单情况。您需要编写一些抓取这些文本文件的代码,然后将其索引到弹性搜索中。

您还必须编写一些代码,以便每次更新或添加页面时,都会调用elasticsearch的webservice来索引或更新它。

Elasticsearch使用REST API,因此您可以使用CURL轻松进行交互,就像任何普通的Web服务一样。此外还有PHP库以简化交互。数据以JSON发送和接收。

我认为弹性搜索在这里很合适,但试试看,并试着看看它是如何工作的。

+0

谢谢!我会给弹性搜索一下! – dallin

相关问题