pos-tagger

    1热度

    1回答

    之前您重定向我到另一个计算器页面,因为我知道有关于加快词性标注了几个问题,我已经通过浏览并加快了我的代码这里的建议:Slow performance of POS tagging. Can I do some kind of pre-warming? 我使用Python 3.6。我有包含约100,000个词的列表已经使用nltk进行了标记。这些都是非常重要的名单,所以我知道标记所有这些单词本质上需

    0热度

    1回答

    IndexError: list index out of rangetag_sents() NLTK SennaTagger方法(http://www.nltk.org/_modules/nltk/tag/senna.html)被调用。 给出了句子列表作为tag_sents方法的输入。 需要阿森纳的可执行文件运行恶搞。 SENNA工具包的安装指南可以在这里找到。 http://ronan.col

    0热度

    2回答

    我目前正在尝试训练我的Python NLTK词性标记器以正确标记德语文本。为了做到这一点我使用的ClassifiedBasedGermanTagger,距离: https://github.com/ptnplanet/NLTK-Contributions/tree/master/ClassifierBasedGermanTagger ,并从该网站训练语料库: http://www.ims.uni-

    0热度

    1回答

    我正在使用StanfordCoreNLP库(stanford-corenlp.jar),并且在执行下面几行代码时出现错误。 protected StanfordCoreNLP pipeline; public LemmatizerHelper() { Properties props; props = new Properties(); props.put("an

    2热度

    1回答

    俄语是否有任何现代的词性标记器+依赖分析器? 我需要一个工具或服务,将能够处理纯文本输出: 划分成句子 划分为令牌 部分的语音标签(细粒度MSD标签欢迎) 引理(碱型) 依赖角色标签 我需要为商业目的的工具。 它可以是一个具有训练有素的统计模型的开源项目,可用于商业目的(如果需要购买)或Web API。最终,它可能是专有模型的专有闭源二进制文件。 俄罗斯的解析模型比我在网上找到的都要求使用Tree

    -1热度

    1回答

    我努力训练的Bangla有Maltparser模型。我注释了Conllu格式的一个小语料库。但它给了我空指针错误。所以我尝试了从UD网站收集的一些树库。它适用于这些数据集。我的问题是 我就可以训练Maltparser型号不XPOSTAG,我已经诠释了UPOSTAG场和XPOSTAG场只是UPOSTAG的副本。我需要注释XPOSTAG吗?这是我的树库和UD之间的唯一区别树库 因为它是为评估目的我可以

    1热度

    1回答

    我正在使用openNLP标记POS(词性)。 InputStream inputStream = new FileInputStream("C:/en-pos-maxent.bin"); POSModel model = new POSModel(inputStream); POSTaggerME tagger = new POSTaggerME(mod

    8热度

    3回答

    在你想POS标签存储在大熊猫数据帧,每行1句大部分实现文本列上SO的情况下使用的应用方法 dfData['POSTags']= dfData['SourceText'].apply( lamda row: [pos_tag(word_tokenize(row) for item in row]) NLTK文档recommends using the pos_tag_sents()

    1热度

    1回答

    我想使用NLTK构建pos标签语料库。这样我就可以根据它来训练我的模型。 到目前为止我已经提到很多来源,但每个人只是解释如何阅读你的标注语料和阅读单词,句子等,以下是一段代码,我想: from nltk.corpus.reader import TaggedCorpusReader reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_

    1热度

    2回答

    如果我想制作一个像NLTK这样的NLP工具包,那么在标记化和标准化后我会首先实现哪些功能。 POS标签或Lemmatisation?