2010-04-15 87 views
11

我正在做一个NLP项目,我需要识别句子中的概念以找到其他类似的概念。我这样做是为了从我已经拥有的列表中推断字词价格。我开始使用WordNet,但它给出了许多相互矛盾的结果。由于矛盾的结果,我指的是具有矛盾价格的词扩展。哪个更好? OpenCyc或ConceptNet?

所以现在我正在研究ConceptNet和OpenCyc。我已经实施了ConceptNet,这非常简单,我喜欢它。问题是OpenCyc似乎有一个更大,更逻辑的刚性数据库,当我在WordNet上发现如此多的“矛盾”时这很重要......但我不知道,因为我没有尝试过。

有人能告诉我是否值得通过(相当大的,对我来说)努力实现OpenCyc,或ConceptNet是否足以推测词价?他们与众不同吗?

如果需要,我会很乐意进一步解释我自己。试图保持它现在简短!

谢谢!

+1

老兄,对不起,没有人回复。你最终做了什么?你能分享你的经验吗? A-Lo – 2011-02-16 03:10:28

+1

我也想了解一些关于您的体验的更多细节。 – 2013-03-20 15:35:53

回答

7

这是不值得的努力。 ConceptNet更好,更容易处理。

当我使用ConceptNet时,它下载了一个sqlite数据库和一个python模块来访问它中的关系。对于OpenCyc来说,这是一个更大的下载,并且必须通过一个Web服务器进行设置,该服务器花费了很长时间才能加载并使用大量内存。事情可能改变了,但这是我的经验。

+1

你能否提供一些论据来支持你的陈述?我试图更多地了解ConceptNet和OpenCyc之间的差异 – 2013-03-20 15:36:39

+3

ConceptNet现在可作为独立的docker VM镜像提供。即插即用。 https://github.com/commonsense/conceptnet5/wiki/Docker – jonincanada 2014-12-19 14:06:57