spacy

1热度

1回答

是否有任何内建的函数/属性来发现条件时的令牌？或者一些可能的绕道去找那些？

-1热度

1回答

OS：Ubuntu的 IDE：PyCharm 从官方网站 PIP安装遵循指令-U spacy 蟒蛇-m spacy.en.download所有代码段下面： doc2 = nlp(u"this is spacy sentence tokenize test. this is second sent! is this the third sent? final test.") for sent

2热度

1回答

如何让Spacy正确地标记am/pm表达式？

Spacy似乎无法正确标记am/pm表达式，其中数字和am/pm部分未被空格分隔。例：“事情发生在上午9时”产生意外的标记集：令牌对象列表：[事情，发生在，LIKE_URL，很] 虽然“事情发生在上午9点”的作品就好了：令牌的对象列表：[事情，发生在9，很] 重现： >>> import spacy >>> nlp = spacy.load('en') >>> doc =

2热度

1回答

SpaCy：为包含多个单词的地址（位置）添加标记器特殊情况

我想从SpaCy帮助下的用户提供的不同句子中提取位置（例如，当用户输入“New York New Orleans “我得到了两个地点”纽约“和”新奥尔良“）。由于SpaCy提供了非常方便的可能性为它的标记器添加特殊情况，我尝试将它们分配到不同的位置（如文档here中所述）。只要地点只包含一个字，一切正常。但只要这些地点包含两个或两个以上单词（如上述“纽约”，“新奥尔良”等等的例子），特殊情况就不会

0热度

1回答

spaCy nlp - 字符串中的标记实体

可以说我有一个字符串，并且希望标记一些实体，如人员和位置。 string = 'My name is John Doe, and I live in USA' string_tagged = 'My name is [John Doe], and I live in {USA}' 我想用{}和具有{}的位置标记人员。我的代码：那么与示例串 import spacy nlp = spac

1热度

1回答

解析Spacy的输出

我知道spacy正在解析给定的句子，并为它做同样的POS标记。但是在解析完这个句子之后，我想了解一下输出。设定为下午7点明天报警，预计输出 { Intent : set_alarm, entity : { "time" : 7PM, "date": tomorrow} } 输出spacy： [ { word: "Set", lemma

0热度

1回答

使用小型Spacy模型创建测试环境

这更像是一个最佳/常见实践问题。我们在我们的生产系统中使用Spacy。在进行测试时，我们不得不下载完整的模型（解析器+单词向量），这些模型可能非常缓慢（约30分钟），令人沮丧。也许更好的策略可能是创建一个自定义的轻量级空间模型进行测试，例如，只有1000个单词vocab和一个较小的解析模型。当使用可应用于此场景的大型数据模型进行测试时，是否提出了策略/最佳实践？

10热度

1回答

是否可以将自己的WordNet添加到库中？

我有一个丹麦WordNet的.txt文件。有什么方法可以将这个与NLP库一起用于Python，比如NLTK？如果不是的话，你会如何用一种不被特定图书馆支持的语言进行自然语言处理。另外还说你想用英语或荷兰语以外的语言在像spaCy这样的图书馆中进行命名实体识别。有没有办法做到这一点？

1热度

1回答

Spacy导入错误了错误的符号

我已经要求他们的GitHub的问题页面上的开发人员，但没有与畅达 conda create -n spacy python=3.5 ipython 到目前为止帮助 https://github.com/explosion/spaCy/issues/855 创建一个新的ENV然后用pip安装spacy（1.6.0）（conda仍然有版本0.101.0） pip install spacy 但我仍然得

0热度

1回答

没有模块命名管道

我想在rasa-nlu中训练一些数据。所以，我安装了anaconda，然后rasa-nlu和spacy。但是，每当我试图运行 python -m rasa_nlu.train -c config.json 我得到 Traceback (most recent call last): File "D:\Ddrive\lib\runpy.py", line 174, in _run_