2011-03-19 62 views
15

我有POS标记与nltk.pos_tag()的一些单词,所以他们给树形标签。我想用已知的POS标签来解读这些单词,但我不知道如何。我在查看Wordnet lemmatizer,但我不确定如何将树库POS标签转换为lemmatizer接受的标签。我怎样才能简单地执行这个转换,还是有一个使用treebank标签的lemmatizer?用NLTK引导POS标记的单词?

+3

我看这是“蒸POS” – fizzer 2011-03-19 20:41:01

+1

一些提示也可以在这里http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik 2014-07-15 15:52:08

回答

28

词网lemmatizer只知道四个部分的语音(ADJ,ADV,NOUN和VERB),只有NOUN和VERB规则做特别有趣的事情。树库标记集中的名词词性都以NN开头,动词标签都以VB开头,形容词标签以JJ开头,副词标签以RB开头。所以,从一组标签转换成另一种是很容易的,是这样的:

from nltk.corpus import wordnet 

morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]] 
+0

卫星形容词怎么样? – user1048677 2016-08-10 22:05:49

+0

卫星形容词与普通形容词一样对待。 – rmalouf 2016-10-01 22:54:24

+0

[penn_tag]从哪里拉? Treebank标签的列表? – Ksofiac 2017-07-24 20:50:07