2016-10-31 48 views
2

我是一位使用Python和NLTK进行NLP操作的新手。从不同的句子开始,我想知道如何从句子中提取某些依赖关系。如何使用NLTK从句子中提取特定信息

例如: 爱德华有一个黑色外套和白色的鞋子搭配红色鞋带

使用词性标注我可以提取语音的某些部分,但我想特别提取他有,例如,黑色外套,最终列出的信息等:

名称:爱德华

服装:黑色外套

鞋:白鞋搭配红色鞋带

+1

你能告诉我们你的代码为POS标记和输出吗? –

回答

2

你要寻找的是NER(命名实体识别)。由于每个句子结构都不相同,所需的信息也不同,因此您可能需要自己制作模板或工作示例here

还有大量的语料库可供您使用。

+0

那么可以根据我正在尝试的POS标签创建自己的语法正则表达式。感谢您及时的回复。 – Boyos123

1

你可以把这个问题看成是提取关系元组,可能是二元关系。在这种情况下,你需要知道约open IE。在这种情况下,您可以提取关系元组,如或。如果你有监督数据,你可以建立你自己的关系抽取模型。否则,使用NER或POSTagging等其他技术不容易提取姓名,服装或其他重要信息。

一种替代方式可以是依赖性分析,但我不知道如何建模它以适应您的特定需求。