2013-04-13 28 views
4

我想从句子中提取从属子句,主要子句,关系子句,限制性关系子句,非限制性关系子句,但我不知道如何完成这项工作。例如:提取条款形式句子

“我第一次在巴黎见过她,我住在九十年代初。”
[主要条款] [亲属条款]

“她伸出受伤的手。
[主条款] [限制性关系条款]

请帮我做这个工作吗?

回答

3

您应该能够通过选区分析来提取此信息(达到合理的准确度)。有许多实现列出了here。对于该列表,我会添加我自己的,可供下载here。 t比任何其他可用的高精度解析器都快,而且记录合理(针对研究代码)。

+1

感谢您的回答。我阅读斯坦福解析器的文档,但我不知道如何编写一个程序来获得主句,......从句子中。请给我一个指导如何让你的语法分析器或其他语言获得Java中的主句子......。 – SahelSoft

+1

在Penn Treebank注释样式中,子句通常标记为'S'。树顶部的'S'节点通常是主要的子句,任何包含的'S'节点都是子节点。当然,这是由碎片(FRAG)和其他相关标签(SBAR,SBARQ等)混淆。您需要查看宾州树库注释指南,并针对您认为应用程序的“主要”和“附属”标签创建自己的启发式。 – AaronD