1
我一直在玩http://corenlp.run/,并注意到它是区分大小写的。 例如,它将“i”标记为FW,将“I”标记为PRP。 我可以训练它忽略大小写吗?更一般地说,我怎么去训练它对于非正确句子?Stanford Parser可以忽略大小写吗?
我一直在玩http://corenlp.run/,并注意到它是区分大小写的。 例如,它将“i”标记为FW,将“I”标记为PRP。 我可以训练它忽略大小写吗?更一般地说,我怎么去训练它对于非正确句子?Stanford Parser可以忽略大小写吗?
CorenNLP具有不区分大小写的模型,只能用于英语。他们称他们为caseless models。阅读警告那里,如果你使用版本3.6.0
一对情侣在链接中提到几点:
TrueCaseAnnotator
。一起训练CoreNLP自己不区分大小写的模型,你可以指定一个令牌预处理程序,忽略大小写
wordFunction = edu.stanford.nlp.process.LowercaseFunction