2010-05-04 120 views
1

我在一家新公司,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用像Salesforce这样的外部服务提供商或其他一些ECM,将来会有很多集成工作。从客户角度来看,这些文档与我们的结构化内容(存储在数据库中,而不是MS Word文档)同样存在。你用什么语言,框架和技术来实现文档搜索?

如果您已经实施了文档搜索,您使用了哪些语言,框架和技术?你有没有失败的故事?使用开箱即用的功能我没有任何问题,但是我认为我们能够控制文档和访问它们的API非常重要。如果我们完全自定义,我想使用Rails。

回答

2

根据您的许可需求,Lucene(LGPL)和Xapian(GPL)都是伟大的,成熟的,快速的搜索引擎API,它绑定了很多语言。我已经用它们两个取得了巨大的成功。

+0

Lucene可能是文档索引的OSS“标准”。 – BlackICE 2010-05-04 14:10:18

+0

好点。但我正在考虑更进一步,并使用Nuxeo或Alfresco作为我们的后端公共存储库。我想我在想,如果这看起来像是矫枉过正,Lucene是更灵活的方式去。只是不想重新发明轮子... – 2010-05-04 14:37:58

1

Lucene可能是最安全的选择,因为它被广泛使用和相当不错。

从Lucene中受益的最简单方法可能是Alfresco,安装起来很轻松,默认情况下为Lucene。这意味着您只需要安装Alfresco,将您的文档放入存储库,并且您可以使用强大的网页搜索界面搜索您的文档。

如果您需要以编程方式进行搜索,我的建议是使用Alfresco'CMIS接口,它允许您以REST方式进行搜索。 JCR API也可用。

相关问题