2017-06-23 33 views
0

我有一组训练刑期,我计算了一些浮动的特点。在每个句子中,两个实体被识别。他们不是'PERSON','ORGANIZATION','LOCATION'或'OTHER'类型。我想将这些类型添加到我的功能矩阵(它存储浮动变量)。如何NER添加标签功能

我的问题是:是否有添加这些实体类型,建议这样做?

我能想到的两种方式现在:

  • 要么增加两列,一个用于每个实体,将被填充有实体类型的ID(例如,0到3个或1至4)
  • 增加八列,每一个实体类型每个实体,并与0的填充它们和1

最好的!

回答

0

我会建议你使用的东西,可以很容易地normalized并且这是在同一范围内的数据的其余部分。

所以,如果你所有的浮点值是-1到1之间,我会在同一范围内不断从你"Named Entity Recognition"值。

所以这取决于你喜欢什么或给你,你既可以在同一范围内的花车其余4个分配值或使用具有更多列的二进制结果最好的结果。

0

最后,第二个建议(增加八列,每一个实体类型和每个实体,并用0和1填充它们)工作得很好!