pos-tagger

    1热度

    1回答

    我有很棒的词,如有趣,有趣,很棒,很好。我想检查一下,如果单词是形容词或动词,就像“爱”是动词,而且是很好的形容词...... 如何使用python或nltk做任何帮助?

    0热度

    1回答

    您好,我正在尝试使用Stanford Pos Tagger为某个句子做POS标签。我使用Python 3.4 NLTK 3.1 windows7的 以下是我使用的代码: import nltk from nltk.tag.stanford import POSTagger import os java_path = r"C:\Program Files\Java\jre1.8.0_66\bi

    0热度

    1回答

    我在Python中使用CRF POS Tagger,训练英文PTB样本语料库,结果相当不错。 现在我想用CRF来训练一个大的越南语料库。我需要添加一些越南的功能到这个标签,如正确的名称,日期时间,数字,...我试了几天,但无法弄清楚如何做到这一点。我已经知道数据的格式,所以它不是问题。 我对Python很陌生。所以任何详细的答案都可能有帮助。谢谢。

    1热度

    1回答

    我有一个严重的问题:我已经下载NLTK 的最后一个版本,我得到一个奇怪的POS输出: import nltk import re sample_text="start please with me" tokenized = nltk.sent_tokenize(sample_text) for i in tokenized: words=nltk.word_tokeniz

    0热度

    1回答

    当我尝试训练一个有40K句子的语料库时,没有任何问题。但是,当我训练86K的句子,我得到的错误是这样的: ERROR:root: Traceback (most recent call last): File "CLC_POS_train.py", line 95, in main train(sys.argv[10], encoding, flag_tagger, k, p

    4热度

    3回答

    喜文本挖掘冠军, 我在Windows 10(客户端环境)使用蟒蛇与NLTK V3.2 当我尝试POS标记,我不断收到一个URLLIB2错误: URLError: <urlopen error unknown url type: c> 看来urllib2无法识别Windows路径?我该如何解决这个问题? 的命令也很简单: nltk.pos_tag(nltk.word_tokenize("Hell

    0热度

    1回答

    我学会使用polyglot为POS标签提供印度尼西亚文本。 import polyglot from polyglot.text import Text, Word text=Text("Menurut dia, Syahganda, dikenal sebagai penggiat isu-isu pertanahan serta perburuhan.") print text.pos

    0热度

    1回答

    我在Python上使用NLTK。我想从txt读取使用default,unigram和pos tagger。然而,我没有这样做,因为没有特定的txt导入标签。例如,在课堂上,我们正在使用准备好的语料库,比如棕色等。我的问题是如何使用标记符导入方法。最终,我希望看到评估每个标记器的性能。

    2热度

    3回答

    我一直在做一些自然语言处理工作。 对于英文POS标记,它很简单,因为我只需要使用内置的nltk函数。我想同样处理德语文本。 由于NLTK没有德国内置的功能,我使用斯坦福POSTagger尝试: from nltk.tag.stanford import StanfordPOSTagger import os import nltk java_path = "C:/Program Files/

    0热度

    1回答

    我试图在jsp中标记我的查询。当我运行它作为一个Java应用程序,它工作正常,但是当我运行它作为jsp,我得到以下异常。 org.apache.jasper.JasperException: javax.servlet.ServletException: java.lang.NoClassDefFoundError: edu/stanford/nlp/tagger/maxent/MaxentTag