lucene

    0热度

    2回答

    我想索引文本,单词文件并搜索这些文件中的某些内容。当我搜索一个特定的字符串时可以,但是当我尝试使用正则表达式进行搜索时,它将不再起作用。在下面,我将列出一些关键的解释代码。 的指数函数: // FileBean is the class contains the file path, // file content, file lastModified information

    0热度

    1回答

    首先,我知道我的问题的标题是含糊不清的,但我不知道该怎么说。你会看到我的例子。 在SQL查询中,可以将'1 = 1'应用于动态条件。 让我举个例子。 select * from PROD.EMPLY WHERE 1=1 AND (NAME = 'JOHN' OR NAME = 'MARY' OR NAME = 'KEVIN') ; 如上所述,我想应用下面的过滤器。 BooleanFilte

    1热度

    1回答

    我想从使用Apache Tika的PDF文件中提取文本内容,然后将数据传递给Lucene进行索引。 ) public static String extract(File file) throws IOException, SAXException, TikaException { InputStream input = new FileInputStream(file);

    1热度

    1回答

    我无法决定将事件信息保存到elasticsearch的方法。信息存储在mysql中,因为我想让它们可过滤,所以我决定使用elasticsearch来索引事件。每个字段的选项数量有限,但允许有多个选项。我应该直接存储的信息是这样的: { "id":"1", "name":"Event A", "type":"Training,Workshop,Meeting",

    0热度

    1回答

    我正在为sitecore中的不同索引(master和web)配置solar和lucen。我使用4.1太阳能和sitecore 8.1。 我已经启用Sitecore.ContentSearch.Solr.DefaultIndexConfiguration和Sitecore.ContentSearch.lucen.DefaultIndexConfiguration配置和各自的索引配置。而rebuldi

    0热度

    3回答

    查找类似主题(一式两份提名)我们有一个网站,用户可以发布内容到网站后适度检查内容,他们发布的,标题和说明是最重要的领域的内容,我们要防止用户发布类似的帖子所以我们寻找实现方法来找到类似的帖子和提示适度这些内容是非常相似的一些旧帖子和版主仔细检查他们的重复,我的意思是警告他们作为可疑重复,我们索引所有内容在弹性搜索和我的问题,我们必须写最佳查询。 这是代码的一部分,我们试过,但 $nameDesc

    1热度

    1回答

    我正在尝试使用Lucene添加搜索功能,但似乎无法获得与重要空白一起使用的索引。我有以下测试案例设置: RAMDirectory directory = new RAMDirectory(); KeywordAnalyzer analyzer = new KeywordAnalyzer(); IndexWriterConfig config = new IndexWriterConfig(an

    0热度

    1回答

    我试图将字符串长度字段添加到索引。理想情况下,我想使用kibana脚本功能,因为我可以稍后'添加'此字段,但我不断得到null_pointer_exception以下代码...我试图根据字段长度对可视化进行排序。 doc['field'].value ? doc['field'].length() : 0 这是正确的吗? 我想这是因为我的领域并非总是设置(稀疏数据),但我增加了?:0必须铲除(

    0热度

    1回答

    我在一个目录中有大量的纯文本文件。我想用索尔来索引它们。我用下面的命令,如其他来源中提到: java -Dc=test -Drecursive -Dauto -jar post.jar folder 但索引0的文件。如果我有较少的文件,然后将以下工作: java -Dc=test -Drecursive -Dauto -jar post.jar folder/* 但在大量文件的情况下,我得到这个错

    1热度

    1回答

    我想日期时间2017-02-17T15:02:00在下面的查询来替代now: POST /myindex/_search { "size": 0, "aggs": { "range": { "date_range": { "field": "Datetime", "ranges": [ { "to": "now-1H/