2017-04-02 46 views
0

KNIME带有多个本地节点,用于执行不同的标签任务,如POS标签或命名实体识别。为了使用已识别的标签或条款,您可以使用Bag of Words节点,该节点会生成条款(不是单词)和关联的标签。然而,这种方法并没有详细说明哪个标签与每个相关联,并且也没有标签(或字)的顺序。在KNIME中获取标签关联

因此,如果你想提取像'POS标签+/- N字相对于实际单词'的特征(例如单词窗口),你怎么能?例如,对于'那个城市是纽约',我希望KNIME生成一个有序列表,如: (其中最后一个NN将是一个命名实体)。

回答

1

是的,这是一个问题。我上周面临同样的情况。

如果你想搭话只是POS机可以将标签为String节点链接到的话节点输出的包,但我觉得对于大文件这种方法失败,因为将有可能为同一得到不同的POS单词(某个单词的POS值由单词的上下文决定),因为单词包节点通过单据显示独特的术语。现在

,为了(“POS标签+/- N个字相对于实际的字”)来获得此窗口为我的解决办法是通过命令行(外部toold节点或由蟒/ JAVA连接弗里代码)并获取每个单词的相应标签,只需查看返回的矢量即可。

+0

这句话的问题在于,你失去了'订单'的概念 - 你只需要一个包。 另一方面,实际上您可以使用Freeling作为服务器并通过套接字调用它,请检查以下内容: https://github.com/TALP-UPC/FreeLing/pull/52 – peleitor