2010-10-01 71 views
0

谁能告诉我什么特征生成器与自然语言处理器有关?什么是自然语言处理中的特征生成器

+0

你将不得不更加具体 - 你在问什么NLP任务?所选功能的类型及其生成方式取决于任务。 NLP有许多任务。 – msbmsb 2010-10-01 14:54:26

+0

确切的报价是: “您必须自己对数据进行名称搜索,以获得更好的结果。使用您自己的培训数据,您甚至可以使用html标签并优化特征生成。” – dagda1 2010-10-03 03:07:14

回答

4

如果我正确阅读这篇文章,我相信这篇引文中的“功能生成”指的是从文本中提取功能的过程。不用过多详细说明,这基本上可以获得您认为对您的预测/分类任务有用的数据维度,并将其放入向量表示中。

例如,假设我们试图创建一个分类器来确定电子邮件是否为垃圾邮件。我们可能会提取诸如CONTAINS_WORD_NIGERIAIS_FROM_PERSON_IN_CONTACT_LIST的功能。或者,如果我们要遵循上面的引用,我们可能会使用诸如PERCENT_OF_WORDS_IN_HREF_TAG之类的html标签来制作专门的功能。正如你可能想象的那样,当功能设计时你可能会过度,而真正的挑战在于优化你的功能集,以便在不可见的数据上给出好的结果。