2011-10-31 62 views
3

我正在用Java构建搜索引擎。搜索引擎应在80个文档中搜索输入到文本框中的单词,然后显示匹配文档的数量,即单词出现在每个文档中的次数。在java中构建搜索引擎

首先,我导入了所有的txt文件并创建了一个类Search。

我需要建立一个索引,以便索引80个文档中的每个单词,以便我可以开发一种算法来比较输入的单词与索引单词并返回结果。

任何建议一开始将不胜感激!

Regards,

Humam。

回答

8

任何建议一开始将不胜感激!

绝对 - Lucene

的Apache Lucene的(TM)是一个高性能,全功能的文本搜索引擎完全用Java编写库。它几乎适用于任何需要全文搜索的应用程序,尤其是跨平台的应用程序。

+0

@TedHopp在这篇文章中,有谁有关于Android的任何说法? –

+0

@Hunter - 我一直在阅读一些Android的帖子,并且仍然在脑海中。当我意识到自己的错误时,我删除了我的评论,希望没有人看到它。显然我太迟了。 :) –

+0

其他值得一看的搜索引擎是[Minion](http://minion.java.net/)(来自Oracle Labs)和[egothor](http://www.egothor.org/)。 –

1

看看FTS capabilities of SQLite。这应该做你想要的东西。

+0

我正在直接从内存中读取文本文件。我没有使用任何数据库。只是一个想法,我怎么能用一个多维数组来存储所有的单词作为索引? – HShbib

+0

查看使用HashMap,目标词作为键和词计数/文档数组作为值。如果没有太多的数据,并且如果简单的相等性测试足以查找单词,这将是实用的。 –