2013-05-05 34 views
-1

我在一个应用程序的工作,我需要实现ePub文件全文检索阅读ePub档案和全文搜索的全文。其中一个我想实现在阅读ePub文件的全文,并推动它在SQLite的数据库,然后使用SQLite的全文搜索的方式。但我很努力地找到一个图书馆来阅读ePub文件的全文或实现全文搜索的文本。我真的很感激,如果有人做到了,或知道一些图书馆可以帮助我实现这一点。 iOS版有一个名为库,但locayta我不能找到任何的Android。请帮忙!安卓上的ePub

回答

0

尝试Apache Tika提取纯文本,然后使用Apache Lucene索引文本。

0

从包中的所有html文件创建一个html文件。

只获取body标签之间的东西,并将它们中的每一个放在<div itemref="itemid">content</div>中。 itemid是OPF文件中页面条目的标识。 这样做是为了能够知道你的搜索匹配是在哪个页面。

然后加载你在一个隐藏的WebView中创建的HTML文件并用javascript搜索,或者在字符串上使用正则表达式而不加载到webview或使用像Gili建议的那样,像lucene一样。