2012-10-29 34 views
0

everyone!如何从一个简历中使用lucene提取信息

我是Lucene的新人。

而我正在使用lucene开展简历过滤器项目。首先,我想从简历中提取一些基本信息,例如bithday等。

假设总是有一行说生日:1989/10/19或类似的东西。我怎样才能用Lucene提取这种信息,而不是直接使用正则表达式。

目前我觉得可能使用SpanNearQuery会有帮助。但似乎我无法将WildcardQuery添加到SpanNearQuery以匹配生日信息。

我完全被困住了。有什么好的建议?万分感激!

+0

Lucene有Regex查询支持。 – Mikos

回答

1

没有神奇的子弹从Lucene字段中提取日期,其中包含一堆文本和日期格式。最好的方法是编写一个自定义分析器,它可以在索引过程中将条件分开,并将数字字符标识为日期。

我写了一对Lucene的分析器,但是类似的东西并不是很简单......特别是如果你是Lucene的新手。