给定一个单词如“table”,我想确定它最常用的名称,它最常用的用法是名词,动词还是形容词。我想在python中做到这一点。除了wordnet以外还有其他的东西吗?我不喜欢wordnet。或者,如果我使用wordnet,我将如何完全使用它?将单词识别为名词,动词或形容词
0
A
回答
5
import nltk
text = 'This is a table. We should table this offer. The table is in the center.'
text = nltk.word_tokenize(text)
result = nltk.pos_tag(text)
result = [i for i in result if i[0].lower() == 'table']
print(result) # [('table', 'JJ'), ('table', 'VB'), ('table', 'NN')]
4
如果你有一个词断章取义,想知道它最常见的用途,你可以看看别人的频率表(例如共发现),或者你可以做自己的罪状:只要找到一个标签足够大的语料库用于您的目的,并计算其实例。如果你想使用免费的语料库,NLTK包括布朗语料库(100万字)。 NLTK还提供了处理较大的非自由语料库(例如英国国家语料库)的方法。
import nltk
from nltk.corpus import brown
table = nltk.FreqDist(t for w, t in brown.tagged_words() if w.lower() == 'table')
print(table.most_common())
[('NN', 147), ('NN-TL', 50), ('VB', 1)]
相关问题
- 1. 如何识别形容词或副词?
- 2. 动词/名词/形容词形式之间的单词转换
- 3. 单词的名词,动词,形容词等的单独列表
- 4. 名词,动词,形容词等的单词列表
- 5. 名词/形容词/其他词典或词典(普通词)
- 6. 如何分别获取名词,动词,形容词synset?
- 7. 将形容词和副词转换为名词形式
- 8. 识别单词
- 9. 为副词和形容词获取相应的动词和名词
- 10. 创建词的其他形式[名词,形容词,复数,动词..一切]
- 11. 在Java中将单词转换成他们的名词/形容词/动词形式
- 12. Perl模块查找单词是否是动词/名词/形容词/文章/介词
- 13. 如何命名为形容词或介词的Rails资源?
- 14. 从动词获取名词词网
- 15. 从名词词组获得动词python
- 16. 名词同义词词网
- 17. Xcode不识别单词“class”
- 18. 如何从棕色语料库中获得动词,名词,形容词?
- 19. POS标记 - NLTK认为名词是形容词
- 20. 为“High Score”建议的动词/名词
- 21. POS tagging - NLTK认为名词动词
- 22. 在Python3与nltk如果某个单词是动词,如果某个单词是动词,名词.etc
- 23. 将单词替换为除Python中的名词和形容词之外的特殊字符串
- 24. 使用词网找到没有名词同义词或至少有一个名词同义词的词条
- 25. 如何训练斯坦福德LexicalizedParser识别新单词作为名词?
- 26. 形容词功能
- 27. 非英语单词的词形化?
- 28. 单词列表的词形化
- 29. 接口命名为形容词
- 30. 分割的正则表达式 - 将单词拆分为词素或词缀
您需要词性标记(http://www.nltk.org/book/ch05.html)。 – Vidul
Wordnet对于一个词的每个* sense *有一个频率(例如'table')。但是自2003年以来这一点并没有得到更新(据我所知)。更好的选择是下载Google n-grams并在该数据集上进行POS标记。 –
你打算如何使用POS标签5字ngrams?这个想法是没有开始的。但谷歌确实提供了由第一个词的POS分类的[ngram文件](http://storage.googleapis.com/books/ngrams/books/datasetsv2.html),所以这将是一种广泛计数的方法。如果你有磁盘空间,并真的需要通过这么多的数据。 – alexis