pos-tagger

1热度

1回答

之前您重定向我到另一个计算器页面，因为我知道有关于加快词性标注了几个问题，我已经通过浏览并加快了我的代码这里的建议：Slow performance of POS tagging. Can I do some kind of pre-warming? 我使用Python 3.6。我有包含约100,000个词的列表已经使用nltk进行了标记。这些都是非常重要的名单，所以我知道标记所有这些单词本质上需

0热度

1回答

当调用NLTK SennaTagger的tag_sents（）方法时，列表索引超出范围错误

IndexError: list index out of rangetag_sents() NLTK SennaTagger方法（http://www.nltk.org/_modules/nltk/tag/senna.html）被调用。给出了句子列表作为tag_sents方法的输入。需要阿森纳的可执行文件运行恶搞。 SENNA工具包的安装指南可以在这里找到。 http://ronan.col

0热度

2回答

random.shuffle（someLazyMap）

我目前正在尝试训练我的Python NLTK词性标记器以正确标记德语文本。为了做到这一点我使用的ClassifiedBasedGermanTagger，距离： https://github.com/ptnplanet/NLTK-Contributions/tree/master/ClassifierBasedGermanTagger ，并从该网站训练语料库： http://www.ims.uni-

0热度

1回答

StanfordCoreNLP错误：未找到此类训练过的标记器配置文件

我正在使用StanfordCoreNLP库（stanford-corenlp.jar），并且在执行下面几行代码时出现错误。 protected StanfordCoreNLP pipeline; public LemmatizerHelper() { Properties props; props = new Properties(); props.put("an

2热度

1回答

俄语的现代依赖分析器

俄语是否有任何现代的词性标记器+依赖分析器？我需要一个工具或服务，将能够处理纯文本输出：划分成句子划分为令牌部分的语音标签（细粒度MSD标签欢迎）引理（碱型）依赖角色标签我需要为商业目的的工具。它可以是一个具有训练有素的统计模型的开源项目，可用于商业目的（如果需要购买）或Web API。最终，它可能是专有模型的专有闭源二进制文件。俄罗斯的解析模型比我在网上找到的都要求使用Tree

-1热度

1回答

问题在培训方面Maltparser型号

我努力训练的Bangla有Maltparser模型。我注释了Conllu格式的一个小语料库。但它给了我空指针错误。所以我尝试了从UD网站收集的一些树库。它适用于这些数据集。我的问题是我就可以训练Maltparser型号不XPOSTAG，我已经诠释了UPOSTAG场和XPOSTAG场只是UPOSTAG的副本。我需要注释XPOSTAG吗？这是我的树库和UD之间的唯一区别树库因为它是为评估目的我可以

1热度

1回答

在Java中使用POSTagger在不同的文件中保存不同的POS（词类）？

我正在使用openNLP标记POS（词性）。 InputStream inputStream = new FileInputStream("C:/en-pos-maxent.bin"); POSModel model = new POSModel(inputStream); POSTaggerME tagger = new POSTaggerME(mod

8热度

3回答

如何申请pos_tag_sents（），以大熊猫数据帧有效

在你想POS标签存储在大熊猫数据帧，每行1句大部分实现文本列上SO的情况下使用的应用方法 dfData['POSTags']= dfData['SourceText'].apply( lamda row: [pos_tag(word_tokenize(row) for item in row]) NLTK文档recommends using the pos_tag_sents()

1热度

1回答

使用NLTK创建pos标签语料库

我想使用NLTK构建pos标签语料库。这样我就可以根据它来训练我的模型。到目前为止我已经提到很多来源，但每个人只是解释如何阅读你的标注语料和阅读单词，句子等，以下是一段代码，我想： from nltk.corpus.reader import TaggedCorpusReader reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_

1热度

2回答

以实施顺序排在第一位：POS标记或Lemmatisation？

如果我想制作一个像NLTK这样的NLP工具包，那么在标记化和标准化后我会首先实现哪些功能。 POS标签或Lemmatisation？