lucene

    12热度

    2回答

    Lucene.Net适合作为频繁更改内容的搜索引擎吗? 或者更具体地说,任何人都可以就lucene.net索引更新的速度给出主观意见。搜索经常变化的内容的任何其他方法都会很好。 我们正在开发一个论坛。论坛帖子将经常添加到论坛库中。我们认为我们需要非常快速地将这些帖子添加到lucene索引(< 0.5s)以便可供搜索。最初在版本库中会有大约5E6个帖子。假设搜索引擎运行在非特殊的服务器上(我知道这非

    16热度

    7回答

    对于HTML和XML文档(本地或基于Web)使用什么样的好爬虫(蜘蛛),并且在Lucene/Solr解决方案空间中运行良好?可能是基于Java的,但不一定是。

    6热度

    2回答

    Lucene的QueryParser.parse(字符串)仍然工作吗? 如果不推荐使用,那么新的语法是什么? Query query = QueryParser.parse(“Ophelia”); 感谢 塔季扬娜

    5热度

    1回答

    我已经实现了使用Lucene.NET(2.0版)网站全文搜索。索引和搜索很好,但我有一个问题。如果我寻找数字(电话号码,产品编号等)作为搜索条件,我没有得到任何结果文档。 我使用的Lucene.Net.Analysis.SimpleAnalyzer类。我想我必须更改分析器和/或Tokenizer。 有什么建议吗? 谢谢!

    2热度

    4回答

    我正在研究使用Lucene和/或Solr在RDBMS驱动的Web应用程序中提供搜索。不幸的是,对于我来说,我已经浏览过的所有文档都涉及如何从索引中获取数据;我更关心如何建立一个有用的索引。有没有这样做的“最佳做法”?

    3热度

    2回答

    我了解Lucene.net如何为文本索引工作。我能否根据给定的日期范围有效地搜索文档?或者Lucene.net只是使用文本匹配来匹配日期?

    3热度

    2回答

    随着stackoveflow.com透视(队2-3工程师建立旨在扩展一个网站项目)是否有意义花力气在发展过程中的早期建立一个基于Lucene/Autonomy的搜索...而不是基于数据库的全文搜索。 优点/缺点: 随着像nutch或autonomy这样成熟的Lucene实现,在后期转向Lucene(这是不可避免的)的成本可以忽略不计。 大量添加额外的索引服务器(比如用nutch)来维护增长的搜索索

    5热度

    3回答

    我们有一个托管应用程序,用于管理内容页面。每个页面可以有多个自定义字段,以及一些标准字段(时间戳,用户名,用户电子邮件等)。 与可能使用该系统的数百个不同的网站 - 什么是处理过滤/搜索的有效途径?描绘你想要缩小的网格视图。您可以过滤特定字段(用户标识,日期),也可以输入全文搜索。 例如,“通过用户标识10开始的所有页面”将在MySQL数据库上一个漂亮的快速查询。但诸如“用户的用户名为10并匹配[

    2热度

    4回答

    我发现关于Lucene和geosearching一篇有趣的文章: http://sujitpal.blogspot.com/2008/02/spatial-search-with-lucene.html 是否有equivilant .NET实现,在那里,我一直无法找到或我必须返工的Java代码他的例子适合.NET框架?

    1热度

    1回答

    有没有办法使用Zend_Search_Lucene来搜索/索引PDF文档?