2014-05-04 72 views

回答

1

命名实体识别是识别实体(人,地点,组织)的表面形式,即“George Bush”或“Barack Obama”是该文本字符串中的“PERSON”实体。

实体提取将从文本字符串中提取附加信息作为属性。例如,在“乔治W.布什是奥巴马总统之前的总统”这句话中,承认“奥巴马”是一位具有“头衔=总统”属性的人。

但是,如果你看看软件的区别往往是模糊的。

0

没有命名实体提取这样的事情。
解释更好的句子我会说,命名实体提取很简单,具体提取以前识别的命名实体的过程。所以,从某种意义上讲,没有真正的理论知识与此任务相关,只是定义机械操作的问题。

如果我们在提取所有特定实体或一段文字关于他们的更多信息,比我们来看看信息知识提取,而不是兴趣。

对于信息提取,您可以例如要求提取出现在文档语料库中的所有城市名称或电子邮件地址。对于这样的任务,可以使用命名实体提取。你甚至可以用更通用的方式,只是简单地提取一般知识,例如以关系(关系提取)的形式提取。

欲了解更多详情,我会建议书Artificial Intelligence: A Modern Approach的自然语言处理章节。