我开始尝试Apache Lucene Core 4,我的问题是... 让asume创建一些文本的索引,并将其存储在名称为“context”的字段中 获取列表是否可行这个字段的标记是否被成功编入索引? 我正在看IndexReader和Field,但不知道如何检索令牌。apache lucene令牌
3
A
回答
0
你有两个选择:
- 你可以重新分析存储领域,
- 或使用term vectors(前提是你能长期在矢量索引时间)。
+0
当创建索引时使用TextField时,是否可以指定创建术语向量? – user1678487
+0
不,您需要创建自己的FieldType实例,然后在Field构造函数中使用它 – jpountz
+0
有趣的是,我有一个文档的条件迭代器。是否有可能找出每个术语的位置编号? – user1678487
相关问题
- 1. Lucene和令牌太长
- 2. Lucene令牌的自定义属性
- 3. Lucene 3上的“令牌”列表
- 4. 查询不带索引的lucene令牌
- 5. Apache Tika与Apache Lucene
- 6. Apache Lucene:如何使用TokenStream在索引时手动接受或拒绝令牌
- 7. Apache lucene索引
- 8. Apache Lucent与Lucene
- 9. StandardAnalyzer - Apache Lucene
- 10. mg4j与apache lucene
- 11. 自动执行Lucene SpanQueries令牌化,还是必须自己令牌查询?
- 12. Apache Lucene中的OutOfMemory
- 13. Apache Lucene的实现
- 14. 什么是Apache Lucene
- 15. Apache Lucene多个Tokenizers
- 16. IllegalAccessError:org/apache/lucene/index/DirectoryReader
- 17. java.lang.Exception:java.lang.NoClassDefFoundError:org/apache/lucene/util/OpenBitSet
- 18. Apache Jmeter - CSRF令牌不匹配
- 19. 用apache cxf加密用户名令牌
- 20. APACHE NIFI invokeHTTP得到令牌的问题
- 21. 的Lucene索引令牌的多次出现时,场内
- 22. Lucene TokenFilter:如何识别来自TokenStream的最后一个令牌?
- 23. Lucene - 令牌过滤器访问不同的字段
- 24. 忽略Lucene的IncrementToken()方法中的令牌输出
- 25. Lucene突出显示:突出显示一个令牌部分
- 26. :'{'令牌'''',',';','asm'或'__attribute__''{'令牌
- 27. Apache Lucene 6.2 StandardAnalyzer版本
- 28. Apache Lucene搜索程序
- 29. 的Apache Lucene索引作家
- 30. 同时使用Apache Lucene的
正如我记得你可以得到的文件,与存储的文本。但我不知道你是否可以访问分析的令牌,我认为不是,因为它取决于你使用的Tokenizer。而在大多数情况下,所有文字都是令牌,而不用停顿等等。 –