spacy

    1热度

    1回答

    是否有任何内建的函数/属性来发现条件时的令牌?或者一些可能的绕道去找那些?

    -1热度

    1回答

    OS:Ubuntu的 IDE:PyCharm 从官方网站 PIP安装遵循指令-U spacy 蟒蛇-m spacy.en.download所有 代码段下面: doc2 = nlp(u"this is spacy sentence tokenize test. this is second sent! is this the third sent? final test.") for sent

    2热度

    1回答

    Spacy似乎无法正确标记am/pm表达式,其中数字和am/pm部分未被空格分隔。 例:“事情发生在上午9时”产生意外的标记集:令牌对象 列表:[事情,发生在,LIKE_URL,很] 虽然“事情发生在上午9点”的作品就好了:令牌的 对象列表:[事情,发生在9,很] 重现: >>> import spacy >>> nlp = spacy.load('en') >>> doc =

    2热度

    1回答

    我想从SpaCy帮助下的用户提供的不同句子中提取位置(例如,当用户输入“New York New Orleans “我得到了两个地点”纽约“和”新奥尔良“)。由于SpaCy提供了非常方便的可能性为它的标记器添加特殊情况,我尝试将它们分配到不同的位置(如文档here中所述)。只要地点只包含一个字,一切正常。但只要这些地点包含两个或两个以上单词(如上述“纽约”,“新奥尔良”等等的例子),特殊情况就不会

    0热度

    1回答

    可以说我有一个字符串,并且希望标记一些实体,如人员和位置。 string = 'My name is John Doe, and I live in USA' string_tagged = 'My name is [John Doe], and I live in {USA}' 我想用{}和具有{}的位置标记人员。 我的代码:那么与示例串 import spacy nlp = spac

    1热度

    1回答

    我知道spacy正在解析给定的句子,并为它做同样的POS标记。但是在解析完这个句子之后,我想了解一下输出。 设定为下午7点明天报警, 预计输出 { Intent : set_alarm, entity : { "time" : 7PM, "date": tomorrow} } 输出spacy: [ { word: "Set", lemma

    0热度

    1回答

    这更像是一个最佳/常见实践问题。 我们在我们的生产系统中使用Spacy。在进行测试时,我们不得不下载完整的模型(解析器+单词向量),这些模型可能非常缓慢(约30分钟),令人沮丧。也许更好的策略可能是创建一个自定义的轻量级空间模型进行测试,例如,只有1000个单词vocab和一个较小的解析模型。 当使用可应用于此场景的大型数据模型进行测试时,是否提出了策略/最佳实践?

    10热度

    1回答

    我有一个丹麦WordNet的.txt文件。有什么方法可以将这个与NLP库一起用于Python,比如NLTK?如果不是的话,你会如何用一种不被特定图书馆支持的语言进行自然语言处理。另外还说你想用英语或荷兰语以外的语言在像spaCy这样的图书馆中进行命名实体识别。有没有办法做到这一点?

    1热度

    1回答

    我已经要求他们的GitHub的问题页面上的开发人员,但没有与畅达 conda create -n spacy python=3.5 ipython 到目前为止帮助 https://github.com/explosion/spaCy/issues/855 创建一个新的ENV然后用pip安装spacy(1.6.0)(conda仍然有版本0.101.0) pip install spacy 但我仍然得

    0热度

    1回答

    我想在rasa-nlu中训练一些数据。 所以,我安装了anaconda,然后rasa-nlu和spacy。 但是,每当我试图运行 python -m rasa_nlu.train -c config.json 我得到 Traceback (most recent call last): File "D:\Ddrive\lib\runpy.py", line 174, in _run_