full-text-search

    15热度

    4回答

    使用Lucene,可以检索索引中包含的术语,即索引中包含文档的唯一词干单词(不包括停用词)。这对于生成其他内容中的自动填充建议非常有用。 MS SQL Server全文索引可能类似吗?

    1热度

    4回答

    我需要确定关键字出现在Word文档的哪些页面上。我有一些工具可以让我看到文档的文本,但没有任何内容告诉我文本出现在哪个页面上。有没有人对我有好的开始?我正在使用.NET 谢谢! 编辑:附加约束:我不能使用任何Interop的东西。 edit2:如果有人知道稳定的库可以做到这一点,那也是有帮助的。我使用Aspose,但据我所知,没有任何东西。

    5热度

    2回答

    在布尔模式下使用MySQL全文搜索时,会使用+和 - 等特定字符作为运算符。如果我搜索类似“C++”的东西,它会将+解释为运算符。处理这些特殊字符的最佳做法是什么? 我正在使用的当前方法是将数据中的所有+字符转换为_plus。它还将&,@,/和#个字符转换为文本表示。

    5热度

    1回答

    我已经实现了使用Lucene.NET(2.0版)网站全文搜索。索引和搜索很好,但我有一个问题。如果我寻找数字(电话号码,产品编号等)作为搜索条件,我没有得到任何结果文档。 我使用的Lucene.Net.Analysis.SimpleAnalyzer类。我想我必须更改分析器和/或Tokenizer。 有什么建议吗? 谢谢!

    1热度

    2回答

    目前,我有一个存储过程,其主要目标是通过电影和电视节目的数据库表进行全文搜索。为了让它做部分关键字搜索,我在SQL中添加了一些代码,用空格分割搜索查询,并输出如下语句: '“batman *”〜“be *”' 例如,可以从用户输入的页面上的文本框生成原始字符串“batman be”,并且在每个javascript keyup事件中,我将该文本框中的任何内容发送到存储的proc以获得结果在我输入时获

    3热度

    2回答

    随着stackoveflow.com透视(队2-3工程师建立旨在扩展一个网站项目)是否有意义花力气在发展过程中的早期建立一个基于Lucene/Autonomy的搜索...而不是基于数据库的全文搜索。 优点/缺点: 随着像nutch或autonomy这样成熟的Lucene实现,在后期转向Lucene(这是不可避免的)的成本可以忽略不计。 大量添加额外的索引服务器(比如用nutch)来维护增长的搜索索

    6热度

    5回答

    目前我有一张表,我搜索4个字段,名字,姓氏,中间名和AKA的。我目前有一个CONTAINSTABLE搜索行,它的工作原理。不好,但它的作品。现在我想让名字的权重更高一些,中间名较低。 我找到了命令ISABOUT但似乎相当值钱,如果我有一句话不是列做到这一点(希望我理解这个错误)。这不是一个选项,如果它的话,因为我不知道用户将输入多少字。 我发现线程here谈论这个相同的解决方案,但我无法获得接受的

    1热度

    1回答

    我们曾经有过一次搜索,它会为某些单词检查两列。两列都必须包含一些提供的单词,所以我们使用AND ...毫无疑问在列上使用FULLTEXT INDEX。 的选择或多或少是这样的: SELECT * FROM SomeTable WHERE (CONTAINS(Column1, 'word1 OR word2') AND CONTAINS(Column2, 'word3 OR word4

    6热度

    4回答

    在过去的几个小时里,我一直在讨论SQL Server全文搜索的各种不同变体。不过,我仍然无法弄清楚排名如何运作。我遇到了一些让我困惑的例子,他们的排名高于其他人。例如 我有一张表,5列+更多没有索引。全部是nvarchar字段。 我运行此查询 SET @SearchString = REPLACE(@Name, ' ', '*" OR "') --Splits words with an OR b

    2热度

    3回答

    SQL Server全文搜索使用特定于语言的Word断字符。 对于德语,这是用来打破/拆分单词,包括复合词。但是,似乎并非所有已知的复合词都包含在Word Breaker中。我想知道是否有一个名单可用的字断路器知道的话。