2010-05-27 49 views
0

我发现很多开源XML数据库(TPOX,Timber,DBXML),但他们正在使用XPath和XQuery,我需要一个为“关键字在XML文档上搜索”而开发的系统。有没有开源的XML文档关键字搜索系统?

+0

你不需要xml数据库来做关键字搜索..你只需要正则表达式。 – 2010-05-27 18:27:18

回答

1

许多XML数据库提供关于它们中的XML文档的关键字索引。您不仅限于XPath表达式。您可以在数据库中的所有文档中执行关键字搜索。

通常,您可以在XQuery中表达关键字查询(并处理查询结果)。请参阅exists-db的示例:http://exist.sourceforge.net/kwic.html

支持仅限于特定元素的关键字,或者您可以在整个文档中执行关键字。见XQuery的全文规格为所有选项:http://www.w3.org/TR/xpath-full-text-10/

BaseX是支持全文(即关键字搜索)规范的另一个开源XML数据库:http://www.inf.uni-konstanz.de/dbis/basex/

如果你想不开源的全文检索尽管您可能想要查看旧的XQengine - http://xqengine.sourceforge.net/ - 或者像其他人说的那样,只需使用Lucene并以此方式索引文档中的所有文本即可。

+0

谢谢,我的问题已答复。有关更多信息,我希望您看一下以下系统(XRANK是对http://www.cs.cornell.edu/~cbotev/XRank上的XML文档进行排名关键字搜索.pdf)和(XSeek是一个使用关键字的语义XML搜索引擎http://xseek.asu.edu/xseekdemo.pdf)。 – houssam11350 2010-05-29 14:34:41

+0

感谢您的链接! – ksclarke 2010-06-04 14:03:17

1

我不确定什么是“关键字搜索”,但您可以设置一个搜索引擎,例如lucene/solr来为您的数据建立索引,然后在其中搜索。