named-entity-recognition

1热度

1回答

是否有任何现有的带标记实体的数据集来训练MITIE模型？我检查了链接，https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py只用两个样本训练模型。是否有任何现有的带标记实体的数据集要训练？

0热度

1回答

重新训练tensorflow模型

我正在训练一个自定义命名实体识别（NER）模型中使用NeuroNER这是使用张量flow.I写我能够训练模型及其表现良好，但是当我重新训练它新的观察，它显示不正确的结果它纠正它们，但其影响/遗忘一些以前的观察它显示正确的结果。我想在线再训练。我尝试使用stanfordNLP，Spacy，现在tensor-flow.please提出了一个更好的方法来达到预期的目标。谢谢

2热度

1回答

定制OpenNLP名称查找在训练集识别数据，而不是测试组

所以我终于OpenNLP纳入我的项目，我已经成功培训了15,000行的训练数据的我的模型，将其存储，并且可以加载它，当我想用它来识别我的程序中的实体！，我用它来识别井号标签，所以我的训练数据看起来是这样的： ... Jim , I know you to be a fighter <START:HASHTAG> #usmarine <END> @ USMC Kira has your

1热度

2回答

从非结构化年鉴文本中提取人名

我有许多美国学校年鉴的人脸肖像和名称的扫描页面。来自页面的所有文本都是OCR化的并且每个页面以多个版本收集：非结构化文本文件。 Example Xml带有每句话的坐标。 Example 带有每个单个字母的坐标的Xml。 Example 的目标是，以确定哪些文本字符串代表的人的名字，并将其与人像有关。问题在于每一本年鉴都是独一无二的，每一页都可能是独一无二的，所以没有共同的模式可以应用（但可能有一

0热度

1回答

MITIE ner model

我一直在探索使用预训练的MITIE模型进行命名实体提取。无论如何，我可以看看他们的实际模型而不是使用预训练模型吗？该模型是否可用作开源软件？

0热度

1回答

Python命名实体识别错误：IndexError：列表索引超出范围

嗨，我是新来的python，并试图运行脚本（https://github.com/detuvoldo/tagger），我取代了utils.py中的2行，因为我使用的是Windows 10，路径相关的问题。 models_path = u"\\\\?\\" + os.path.abspath(u".\\models") eval_path = os.path.abspath(u".\\evalua

2热度

1回答

如何找到斯坦福NLP命名实体的指标

我使用Python包装斯坦福NLP 的代码，以查找命名实体是： sentence = "Mr. Jhon was noted to have a cyst at his visit back in 2011." result = nlp.ner(sentence) for ne in result: if ne[1] == 'PERSON': print(ne) 输出

0热度

1回答

计算实体在NLP中的置信度得分命名实体识别

我正在从文档（pdf）中进行命名实体提取。每个PDF包含组实体（近16个不同类型的实体）这里是我的步骤，构建NLP和ML车型： Step 1：分析文档。有近2百万令牌（单词）。用这些词和CBOW方法构建word2vec模型。 Step 2：通过使用word2vec模型，生成向量的单词在douments。 Step 3：根据域，我为培训，验证和测试标记单词（向量）。 Step 4：带标签的数据，训

1热度

1回答

NLTK标记化但不分割命名实体

我正在研究一个简单的基于语法的分析器。为此，我需要首先标记输入。在我的文章中出现了很多城市（例如纽约，旧金山等）。当我使用标准的nltk word_tokenizer时，所有这些城市都会被拆分。 from nltk import word_tokenize word_tokenize('What are we going to do in San Francisco?') 电流输出： ['W

1热度

1回答

命名实体提取日期

我对NER和提取和编程一般都是新手。我正在设法找出一种方法，可以提取某些文档的截止日期和开始日期。有没有办法做到这一点？我可以开始的地方？我一直在看，但我遇到的问题是一样的。可以提取日期，但不能确定日期是到期还是过帐。如果它只有一个日期，它是过帐还是到期。像这样的东西。任何帮助，将不胜感激。例子： “在中世纪亚洲征文9月3日，是由于”。 “你在4月6日给出的最后一项任务应该在10天内提交。” “