named-entity-recognition

    0热度

    1回答

    我最近在一个涉及命名实体识别的项目中工作。 我通过提供自己的训练数据来生成NER模型。 NER的问题在于,一旦遇到完全停止,它就会停止标记。 例如,如果我有像文 “John是在印度。他的作品在英特尔公司的” 的NER恶搞将会给上面的文字 以下输出 “John-NAME”“works-O”“in-O”“India-PLACE”。 它不处理连续句子 即“他在英特尔公司” 所以基本上它在句号(。)中断。

    0热度

    1回答

    我想训练一个NER模型印度与自定义NE(命名实体)字典块。我指的是NLTK斯坦福NER repectively: NLTK 我发现nltk.chunk.named_entity.NEChunkParsernechunkparser能够在一个自定义的语料训练。但是,文档或源代码的评论中没有规定训练语料库的格式。 我在哪里可以找到NLTK中NER自定义语料库的一些指南? 斯坦福NER 按照questi

    1热度

    1回答

    我想使用斯坦福NER在nltk中进行中文实体识别,但无法找到分类器。有人会知道这是什么吗? 该模型在网站上提供,但不是分类器。 找到了分类的副本在这里: http://blog.csdn.net/shijiebei2009/article/details/42525091 ,但它不ntlk工作, ,并提供了以下错误: 找不到或无法加载主类edu.stanford.nlp.ie.crf.CRFCla

    2热度

    1回答

    我正在使用StanfordNER分类器。有4个分类器 english.all.3class.distsim.crf.ser.gz english.muc.7class.distsim.crf.ser.gz english.conll.4class.distsim.crf.ser.gz example.serialized.ncc.ncc.ser.gz 这些分类器是如何构建的?由于每个人基

    3热度

    1回答

    在NLP中有一个概念Gazetteer,它对创建注释非常有用。据我了解, A gazetteer consists of a set of lists containing names of entities such as cities, organisations, days of the week, etc. These lists are used to find occurrences o

    -1热度

    2回答

    我试图想出一些规则来检测命名实体,特别是文本中的公司或组织名称。我认为把焦点放在动词上是有道理的。有很多POS Taggers,可以很容易地检测专有名词。我个人喜欢StanfordPOSTagger。现在,一旦我拥有专有名词,我知道它是一个命名实体。然而,要确定它是一家公司的名称,我需要提出规则,并可能需要规则Gazetteers 我正在考虑专注于动词。公司名称周围是否经常出现一组常见动词? 我可

    2热度

    2回答

    我正在使用Python处理数据科学相关任务。我需要做的是 - 我已经提取了一些新闻文章,现在我想有选择地选择属于特定人的新闻文章,并确定文章中提到的人是否是我感兴趣的同一个人。 假设一个人可以通过他的名字或描述该人的特定属性来识别,例如,名字为“X”的人是一个政治人物。当发表关于该人的文章时,我们'知道'它只是通过阅读文章的上下文来提及那个人。通过“语境”我的意思是,如果文章包含任何(以下或组合)

    2热度

    1回答

    我正在尝试执行我已为我的自定义名称进行培训的OpenNLP模型。我执行下面的命令进行定制的模型: opennlp TokenNameFinderTrainer -encoding UTF-8琅恩-data C:\用户\ nshah \桌面\ EN-NER-person.train -model EN-ner- personName.bin 我能够成功地创建一个名为EN-NER-personName

    1热度

    1回答

    我想使用pyner库来从句子中提取名称。 我在我的Ubuntu机器上安装了ner,然后我为测试编写了下面的脚本。 >>> import ner >>> tagger = ner.HttpNER(host='localhost', port=80) >>> tagger.json_entities("Alice went to the Museum of Natural History.")

    1热度

    2回答

    这种情况发生时,有一个潜在的NE后跟一个逗号,例如,如果我的字符串是类似, “这些名字的Praveen库马尔,,大卫·哈里森,保罗哈里森,嗒嗒“ 或 ”加利福尼亚州,美国“ 我的输出分别如下所示。 [[(u'These 'u'O '),(u'names',u'O '),(u'Praveen',u'O'),(u'Kumar ,, ',u'O'),(u'David',u'PERSON'),(u'Har