是否可以使用Solr在HTML文件中搜索抓取网站?使用Solr搜索HTML标记?
0
A
回答
1
Solr只是搜索索引。看看nutch抓取网页。 http://nutch.apache.org/about.html solr将索引HTML就好了。
0
报价http://wiki.apache.org/nutch/NutchTutorial#A4._Setup_Solr_for_search
如果一切计划,我们现在准备与 http://localhost:8983/solr/admin/进行搜索。如果你想看到的Solr索引的原始的HTML ,schema.xml中更改内容字段定义:
相关问题
- 1. Solr的标记搜索结果
- 2. 如何在solr中搜索html标签?
- 3. 如何使用solr空间搜索在两个坐标之间搜索记录
- 4. 使用Solr为具有属性的HTML标记编制索引
- 5. Solr搜索使用Susnpot Gem
- 6. solr像使用text_en搜索
- 7. Solr搜索 - 使用查询
- 8. Solr标题搜索失败
- 9. Solr搜索完整标题
- 10. SOLR在solr 4.8.1版本中使用#标签搜索
- 11. SED搜索和替换HTML标记
- 12. 通过HTML标记进行XPath搜索
- 13. 索引/搜索PDF内容使用Solr
- 14. 搜索网页中的HTML标记使用URL
- 15. 用lxml搜索£标记
- 16. 搜索Solr的
- 17. Solr + Haystack搜索
- 18. Apache Solr搜索
- 19. Solr的 - 搜索
- 20. 搜索与SOLR
- 21. CFSearch + Solr:忽略搜索中的HTML
- 22. 使用PHP搜索HTML标签
- 23. 使用Solr搜索服务器搜索多个索引
- 24. 如何使用任何过滤器选项搜索记录SOLR?
- 25. 在Solr的不同字段中搜索不同的标记
- 26. Solr:排除某些HTML标记或仅包含索引内的某些标记
- 27. 用Apache Solr搜索名字
- 28. 面搜索用(出)Solr的
- 29. solr无法使用确切值搜索
- 30. Solr使用连字符精确搜索