我有POS标记与nltk.pos_tag()的一些单词,所以他们给树形标签。我想用已知的POS标签来解读这些单词,但我不知道如何。我在查看Wordnet lemmatizer,但我不确定如何将树库POS标签转换为lemmatizer接受的标签。我怎样才能简单地执行这个转换,还是有一个使用treebank标签的lemmatizer?用NLTK引导POS标记的单词?
回答
词网lemmatizer只知道四个部分的语音(ADJ,ADV,NOUN和VERB),只有NOUN和VERB规则做特别有趣的事情。树库标记集中的名词词性都以NN开头,动词标签都以VB开头,形容词标签以JJ开头,副词标签以RB开头。所以,从一组标签转换成另一种是很容易的,是这样的:
from nltk.corpus import wordnet
morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]]
卫星形容词怎么样? – user1048677 2016-08-10 22:05:49
卫星形容词与普通形容词一样对待。 – rmalouf 2016-10-01 22:54:24
[penn_tag]从哪里拉? Treebank标签的列表? – Ksofiac 2017-07-24 20:50:07
- 1. nltk pos标记expletives
- 2. POS标记 - NLTK认为名词是形容词
- 3. NLTK中单个单词的标记器
- 4. 评估NLTK中的POS标记器
- 5. 自定义词性标记与回退到nltk内部pos
- 6. Python NLTK PoS标记不准确
- 7. POS tagging - NLTK认为名词动词
- 8. NLTK单词词性标注
- 9. 计算NLTK标记语句中(word,pos)元组的POS数量
- 10. 使用退避标记在nltk中标记pos
- 11. 在NLTK解析器语法中混合单词和PoS标签
- 12. 在R中为单个单词/标记创建POS标记
- 13. 如何使用NLTK(pos标记)获得不定式形式的动词
- 14. 检查Nltk POS标签
- 15. 使用NLTK中的POS标签的CFG
- 16. 用于POS标记和Lemmatizer的多语言NLTK
- 17. 如何在给定POS标签的NLTK中共轭动词?
- 18. 在python中为给定单词提取不同的POS单词nltk
- 19. R-POS pos()函数如何用于词类标记
- 20. 使用POS标签获取单词?
- 21. 在pos标记后提取形容词
- 22. NLTK单词lemmatizing
- 23. 更改NLTK树叶中的POS标记的值
- 24. 用于简单POS标记的NLP库
- 25. Python:将NLTK Stanford POS标签映射到WordNet POS标签
- 26. nltk中的数字POS标记训练(python)
- 27. POS标记NLTK语料库中的正则表达式
- 28. 不希望NLTK单词标记化将单个单词'gotta'标记为'got'和'ta'
- 29. NLTK无法找到斯坦福POS标记模型文件
- 30. 使用RNN的POS标记
我看这是“蒸POS” – fizzer 2011-03-19 20:41:01
一些提示也可以在这里http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik 2014-07-15 15:52:08