2016-03-23 46 views
0

以下面的句子作为〔实施例(从GATE官方幻灯片教程得到:模块11 https://gate.ac.uk/sale/talks/gate-course-may10/track-3/module-11-ml-adv/):GATE如何处理机器学习(文本分类)?

我被告知,该项目是在股票和可次日送货。几天后,我追查他们被告知有错误,没有存货。几天后再次追赶,仍然没有股票,然后发现他们从一开始就给我发了账单。所以他们有我的钱一个星期以上 - 不知道他们什么时候会有股票 - 我已经完成了所有的追逐。尽管别人说在八年的互联网购物最糟糕的经历到目前为止没有。

当GATE机器学习PR(批量学习)中的整个句子被标记为anntation并作为实例对待时,GATE如何处理学习过程?

我有两个猜测。一个是GATE自动地为句子中的每个单词添加人类语义,并收集这些特征来建立一个分类模型。另一个是GATE简单地将句子变换为数学变量,如向量,并根据语言学特征训练模型,如使用多少个名词,adj,adv。

我不确定哪一个是正确的,或者是否会有另一个解释。希望有人可以提供确认或任何相关信息。

谢谢!

回答

0

GATE根据您在配置xml文件中的定义构建模型。除了实例类型之外,可能会有像Token(具有root,POS,...)或N-gram或由JAPE规则创建的自己的注释(带有功能)的注释。 Gate将使用你的定义并建立一个模型。

+0

谢谢ashingel。但是如果实例或我自己的注释是短语或句子,它们会被分成单个单词来进行机器学习的特征提取吗? –