我正在开发一个应用程序,它将从网站上抓取数据。诸如page_url,site_url,last_modified的细节将被存储在数据库中,并且page_content将被存储在文件中。稍后我要搜索文件的内容。我正在尝试Thinkingsphinx来实现这一点。任何机构有一个想法如何实施它?使用SPHINX/ultrasphinx对索引文件进行索引
0
A
回答
1
我不相信Sphinx/ThinkingSphinx适合你,因为他们打算与数据库交谈。
0
你能切换到Solr全文搜索呢?我听说它可以像PDF或字
http://lucene.apache.org/solr/tutorial.html[enter链接这里描述]即使指数二进制文件[1]
相关问题
- 1. 如何使用Apache索引对文件系统进行索引
- 2. 使用索引对索引HTML进行索引
- 3. 对大量XML文件进行索引
- 4. 使用2dsphere索引和IP地址索引对mongodb集合进行索引
- 5. 使用hash#对网址进行索引
- 6. 对查询进行索引
- 7. 使用sqlite进行搜索索引?
- 8. 使用搜索索引进行筛选
- 9. 使用PostgreSQL中的约束对ORDER BY使用的索引进行索引
- 10. 索引对使用&&
- 11. 使用索引数组在Python中进行索引
- 12. 在Deep Link中使用&符号进行索引编制索引
- 13. 按R索引对索引进行排序
- 14. ElasticSearch索引 - 选择Java对象进行索引?
- 15. R使用行索引合并文件
- 16. 使用python对基于索引和非索引列的表值进行排序
- 17. 使用索引对数组进行排序会导致索引太多
- 18. 用Lucy进行索引和搜索
- 19. 如何应用索引进行搜索
- 20. 文件索引
- 21. 使用Solrnet对富文档进行索引
- 22. db索引文件执行
- 23. 对档案文件进行全文索引
- 24. 使用$和参数进行索引?
- 25. 使用列索引进行dplyr 0.5.0 mutate
- 26. 使用Matplotlib进行多索引绘图
- 27. 使用Git进行源码索引
- 28. 阻止使用索引进行查询
- 29. 使用Lucene.net进行索引版本化
- 30. 使用索引进行数字排序
你能建议我一个很好的解决方案然后? – Pravin 2011-03-22 09:49:40
我不知道有我自己。我现在快速浏览一下,如果我找到任何东西,我会告诉你。我可以说,Solr /太阳黑子看起来不像选项:) – lebreeze 2011-03-22 09:50:33
狮身人面像下的xmlpipe选项呢?我实际上正在努力实现,但没有得到如何.. – Pravin 2011-03-22 09:51:49