我有一个巨大的XML文件,大小约2GB,包含简历。这个文件中有成千上万的简历,正确标记。现在我正在使用XPATH来查询它。那么建议使用Lucene而不是XPATH?为此,建议使用Lucene吗?
0
A
回答
1
像所有其他技术相关的,这取决于。
什么Lucene的给你,你没有使用XPath得到的是一个全文引擎除其他事项外排名和能力,短语查询,支持电力,通配符查询等。根据您的使用
- 我想说,在全文搜索引擎是有道理的。这并不是说,香草Lucene是最好的方式去(例如有其他的选择建立在Lucene上)。
3
取决于您的要求。如果您需要全文搜索和全面搜索引擎的所有其他强大功能,Lucene就是要走的路。我会推荐Solr,它建立在lucene之上,并提供更好的API和抽象。
1
2GB似乎是相当少的,我会构建自己的倒排索引(最小的一个:))然而,使用Lucene/Solr虽然没有问题。前进。它会帮助你一旦你的记录开始翻倍。然而,在这种规模(2GB)甚至更大的情况下,许多现实生活中的东西正在使用像关键字这样的SQL进行数据库全文搜索。
相关问题
- 1. 建议只使用没有数据库的Lucene索引吗?
- 2. 使用Lucene的提示/建议
- 3. 使用Lucene SpellChecker的有条件建议
- 4. 建议使用DoctrineMigrationsBundle吗?
- 5. 建议使用Java解析此XML
- 6. 使用MongoDB时建议使用Memcache吗?
- 7. 你可以使用Lucene作为OODB吗?
- 8. 建议使用node.js构建论坛吗?
- 9. 您为此建议使用哪种版本控制软件包
- 10. 关于使用Lucene的体系结构的建议?
- 11. 建议使用Lucene或Solr的蜘蛛工具?
- 12. Lucene附近的单词建议
- 13. 需要Lucene查询优化建议
- 14. 建议使用GAE类型吗?
- 15. 建议在mongodb中使用Hibernate吗?
- 16. 有关jQuery使用css3的建议吗?
- 17. 建议使用Wild Card SSL证书吗?
- 18. 建议使用CSS框架吗?
- 19. 最好是使用lucene KeywordAnalyzer为自动建议文本框索引文本?
- 20. 建议使用GCE作为网络服务器吗?
- 21. 建议使用Redis或Memcached作为FILES的缓存吗?
- 22. 将convertin CSV的ETL Pentaho建议(或SQL建议)转换为此表格格式
- 23. 不建议使用CMS构建Web应用程序吗?
- 24. 建议使用片段构建所有应用程序吗?
- 25. 我可以为此使用DependencyProperty吗?
- 26. 我可以为此使用Regex吗?
- 27. 我应该为此使用BlazeDS吗?
- 28. 如何使用此建议的intelliJ命令禁用双缓冲?
- 29. 我应该为此创建索引吗?
- 30. 我可以为此创建模板吗?
非常感谢:)。 – John 2012-03-09 08:21:45