这是我第一次使用Lucene的,我有一个文本文件是这样的:如何使用Lucene索引和搜索结构文本文件?
id,name,address,hobby
1,namm1,address1,football
2,namm2,address2,football
3,namm3,address3,football
4,namm4,address4,football
5,namm5,address5,football
6,namm6,address6,basketball
7,namm7,address7,basketball
8,namm8,address1,football
9,namm9,address8,swimming
...
上面的文件是一个文本文件,其中包含百万行。现在,我要查找其地址为address1
和爱好是从文件football
记录,然后把记录到一次像这样的文件:
1,namm1,address1,football
8,namm8,address1,football
...
第一个文件是非常大的,所以这将是非常慢慢找到一个又一个的记录。我想用Lucene为第一个文件建立一个索引(根据地址和爱好)。然后,我可以快速找到地址为address1
,其业余爱好为football
的记录,并将其放入新文件中。我从来没有使用Lucene进行编程。谁能给我一个类似的例子?
你为什么这么渴望使用它的lucene? lucene和IR一般用于非结构化文本。对于结构化文本,可以使用结构化数据库和sql - 这可能会简单得多 – amit
谢谢您的回复。实际上,我遇到的问题要复杂得多。为了明确问题,我简化了它。我已经使用数据库来解决问题。但后来,需要更新数千万条记录,需要建立大量的临时表。时间复杂度和空间复杂度都太难了。所以我想试试Lucene。谢谢! –