我正在开发一个组件,用于存储URL并维护与这些URL关联的一组特定关键字。对于示例 -使用关键字存储网址 - 最佳方法是什么?
网址:http://www.imdb.com 关键词:搜索,电影,电影指数,回顾
自己不受数量的限制关键字。网站数量可能在10K到100K之间。使用关键字关联和存储网址的最佳方法是什么?这应该支持通过关键字搜索和基于关键字组合的列表。我当然觉得这不是一个好的方法来使用关系数据库。
也许我的问题总结为“如何做一个搜索引擎的工作。”但我正在寻找更具体的信息,如是否有可用于存储关键字和索引的工具?我听说过Apache Lucene,这似乎更像是一个全文搜索引擎。
是什么计算器内部使用的关键字相关联的文章?
你应该看Apache Solr实现(建立在Lucene的),您的需要。它完全符合你的需求。 – Mikos 2010-07-29 13:28:43