spacy

    0热度

    1回答

    我一直在试图训练一个模型#887使用相同的方法,只是为了一个测试用例。 我有一个问题,训练语料库在空间导入的最佳格式是什么。我有一个带有实体列表的文本文件,需要用于标记的新实体。 让我解释一下我的情况,我按照update.training这样的脚本: nlp = spacy.load('en_core_web_md', entity=False, parser=False) ner= Enti

    2热度

    4回答

    我试图安装spacy运行pip install spacy为蟒蛇版本3.6.1但不断我得到像下面的错误,如何摆脱这个问题?以前我有cl.exe没有找到错误,之后,我添加了cl.exe所在的环境变量中的visual studio路径。 Failed building wheel for spacy Running setup.py clean for spacy Running

    1热度

    2回答

    我正在尝试使用Spacy训练NER和我自己的数据。我的问题是如何将我训练有素的NER整合到原始模型中?这样可以方便地不断训练和使用我的应用程序。我没有找到任何样品。 我在下面发现了一些类似的例子来训练NER,但似乎所有这些都不会保存训练好的模型并将其整合回Spacy。有些保存在内存中,有些将NER模型保存到额外的文件夹中......那么如何以适当的方式来满足我的需求呢?谢谢 !!! 我使用spac

    0热度

    2回答

    在包含主题标签,如鸣叫一句,spacy的标记者分裂井号标签分为两个标记: import spacy nlp = spacy.load('en') doc = nlp(u'This is a #sentence.') [t for t in doc] 输出: [This, is, a, #, sentence, .] 我想有记号化这样的井号标签: [This, is, a, #sent

    0热度

    1回答

    我想使用python库spacy来匹配文本中的记号(将标签添加为语义引用)。然后,我想用这些匹配来提取令牌之间的关系。我的第一个是使用空间的matcher.add和matcher.add_pattern。该matcher.add工作正常,我能找到的标记,我的代码至今: import spacy nlp = spacy.load('en') def merge_phrases(matche

    0热度

    1回答

    我的目标是在空间的帮助下训练独立的NER。 Spacy提供standalone ner trainer 它可以帮助保存模型并将其加载到nlp管道中。 我准备了以下格式的培训数据。 MUST, O have, O experience, U-technology as, O a, O translator, O , , O editor, U-technology

    0热度

    3回答

    我是新来的spaCy和NLTK作为一个整体,所以我提前道歉,如果这似乎是一个愚蠢的问题。 基于spaCy教程,我必须使用以下命令将文本加载到文档中。 doc = nlp(u'Hello, world. Natural Language Processing in 10 lines of code.') 但是,我在sql server或excel上以表格格式存储了很多文本。它基本上有两列。第一列

    10热度

    7回答

    在运行时: import spacy nlp = spacy.load('en') 下面印: 警告:没有发现 '恩' 只有加载 'EN' 标记生成器模型。 /site-packages/spacy/data是空的,但init文件除外。 所有的文件路径都只指向我单独安装的python。 任何帮助赞赏解决此问题。 谢谢! 将

    3热度

    1回答

    我想在使用python和gensim的英文维基百科上训练word2vec模型。我密切关注着https://groups.google.com/forum/#!topic/gensim/MJWrDw_IvXw。 它适用于我,但我不喜欢产生的word2vec模型是命名实体被拆分,使得模型对我的特定应用程序不可用。我需要的模型必须将命名实体表示为单个向量。 这就是为什么我计划用spacy解析维基百科文章

    0热度

    1回答

    我想知道是否可以更新Spacys默认词汇表。我试图做的是这样的:对我自己的语料库与gensim 载荷向量到我的模型与nlp.vocab.load_vectors_from_bin_loc(\path) 但自从我的文集很多的话大家还不 运行word2vec t在spacys默认词汇表我无法使用导入的向量。有没有一种(简单)的方式来添加这些缺失的类型? 编辑: 我意识到混合载体可能会有问题。所以我的问