2012-09-17 56 views
3

我开始尝试Apache Lucene Core 4,我的问题是... 让asume创建一些文本的索引,并将其存储在名称为“context”的字段中 获取列表是否可行这个字段的标记是否被成功编入索引? 我正在看IndexReader和Field,但不知道如何检索令牌。apache lucene令牌

+0

正如我记得你可以得到的文件,与存储的文本。但我不知道你是否可以访问分析的令牌,我认为不是,因为它取决于你使用的Tokenizer。而在大多数情况下,所有文字都是令牌,而不用停顿等等。 –

回答

0

你有两个选择:

  • 你可以重新分析存储领域,
  • 或使用term vectors(前提是你能长期在矢量索引时间)。
+0

当创建索引时使用TextField时,是否可以指定创建术语向量? – user1678487

+0

不,您需要创建自己的FieldType实例,然后在Field构造函数中使用它 – jpountz

+0

有趣的是,我有一个文档的条件迭代器。是否有可能找出每个术语的位置编号? – user1678487