2014-03-24 101 views
1

我有一个Lucene的场景,我不确定(阅读文档后)什么是我的代码的最佳模式。如何查询许多不同形状的文档?

基本上我有很多(超过40)不同的“形状”我的数据。例如,新闻报道中包含“标题”,“说明”和“正文”字段以及带有“概述”,“问题”,“解决方案”,“解决方法”等字段的技术kb类型文章。

我知道我可以对这些不同的非统一问题进行物理索引,但我不太喜欢这个想法(我将搜索的物品类型数量很多),以至于我的查询最终会显示为标题:搜索或说明:搜索或正文:搜索或概述:搜索或......你的想法...

创建一个“标准”字段的集合,获取数据shoehorned到,什么是我的选择?

回答

0

您可以有1个字段包含来自每个字段的所有文本,然后也可以按每个字段分解文本。我在医疗信息学中见过这方面的工作。