我使用Stanford POS Tagger(通过Python中的NLTK)标记西班牙文本。Stanford Spanish POS Tagger的含义
这里是我的代码:
import nltk
from nltk.tag.stanford import POSTagger
spanish_postagger = POSTagger('models/spanish.tagger', 'stanford-postagger.jar')
spanish_postagger.tag('esta es una oracion de prueba'.split())
结果是:
[(u'esta', u'pd000000'),
(u'es', u'vsip000'),
(u'una', u'di0000'),
(u'oracion', u'nc0s000'),
(u'de', u'sp000'),
(u'prueba', u'nc0s000')]
我想知道我在哪里可以找到究竟意味着pd000000,vsip000,di0000,nc0s000,sp000?
感谢您的回答。 – 2014-11-20 21:12:36
有没有一种方法可以使用斯坦福NLP获取完整标签?其实我最感兴趣的是动词的人物,数量和性别。使用Freeling POS Tagging时我能够做到这一点,但我不知道如何使用斯坦福NLP。 – Kage 2015-04-10 07:34:54
凯奇,我已经在这里回答你的问题:http://stackoverflow.com/questions/29556109/spanish-pos-tagging-with-stanford-nlp-is-it-possible-to-get-the-person-number – 2015-04-10 13:57:18