uima

2热度

1回答

我们有一个带有多个独立注释器的UIMAFit管道，寻找并行执行它们的方法。请建议。如何以下方法 1）通过分组注释 2创建多个分析引擎）从池中获取JCAS的情况下，用相同的文字初始化。 3）使用java线程执行器框架并行运行分析引擎。 4）合并Jcas

0热度

1回答

内存泄漏或拥有修改过的DeepLearning4Java的拥挤工作者（使用akka）

我正在使用DeepLearning4Java的修改版来使用UIMA CollectionReader处理文档。对于大型文档集合，我遇到了GC开销限制错误或不同类型的TimeOut错误（例如线程“RMI TCP连接（空闲）”中的异常），因为垃圾收集花费更多时间。我不确定这是内存泄漏还是我在工作人员邮箱中堆积太多工作。我不熟悉scala和akka，但这并没有帮助。会发生什么情况是我的应用程序运行良好

3热度

1回答

什么是UIMA CAS（通用注释结构）的NLTK等价物？

在UIMA中，CAS（通用注释结构）在构建NLP应用程序中起着重要作用。它允许将组件添加到下一个组件的元数据。例如，来自句子标记器的句子边界可以被添加到CAS并被随后的词标记器使用。 NLTK中的等效数据结构是什么？

3热度

1回答

您应该如何在UIMA Ruta中使用DKPro库？

我研究的默认UIMA鲁塔工作台Eclipse项目足以显著了解它的运动部件 - 例如，为什么input/和output/文件夹，表现为他们做什么，如何使用jcasgen和其他Maven插件完成项目等但是即使经过几个小时的学习项目并与Maven一起试图使其运行起来，我仍然遇到了很多麻烦：使用Ruta脚本中的DKPro库（特别是类型）。我的根本问题是这样的：在Ruta脚本中使用DKPro和TC库中的

2热度

1回答

在Eclipse GUI外部使用Ruta TextRuler

我有几个关于UIMA Ruta TextRuler的问题。是否有可能（我认为它应该是）在Eclipse GUI之外使用TextRuler？如果是这样，则可以提供调用它包括以下参数的GUI的外侧的一个例子（因为它们是被提供给GUI为TextRuler，相同的）：训练数据文件夹附加数据文件夹（这是什么？）测试数据文件夹评估测试数据预处理脚本文件跳过预处理脚本文件种信息类型，以尝试提取

2热度

1回答

如何访问UIMA中的文档元数据？

如何使用UIMA和JCas访问文档元数据，如创建和修改日期或标题等？

2热度

1回答

如何在Ruta脚本中访问不是原始类型的特征值？

我可以访问使用Ruta脚本定义为基本类型的功能。例如，posTag是TokenAnnotation的字符串功能。以下脚本起作用。 STRING str1，str2;TokenAnnotation { - > GETFEATURE（“posTag”，str1），LOG（“posTag =”+ str1）}; 但是，我无法读取定义为另一个Annotation类型的功能。 TokenAnnotatio

0热度

1回答

Apache UIMA + Apache Solr集成名词短语注释器

我正在开发Apache UIMA + Apache Solr集成。首先我已将Apache UIMA与eclipse集成。我在eclipse中实现了NOUN短语注释器，并且运行了几个例子。它工作得很好，并通过查找名词来给出准确的结果。现在我试图用Solr实现UIMA。我也跟着下面的链接是相同的： https://wiki.apache.org/solr/SolrUIMA 我已出口工作的Eclip

0热度

1回答

UIMA/dkpro：获取连接类型

我正在使用UIMA与UIMAfit和dkpro以及StanfordParser一起解析英语句子。我可以毫无问题地构建依赖关系树。对于“和”/“或”连词，我得到了CONJ类的注释，这是Dependency的一个子类。截至目前，我没有发现，如何检查找到的连词是“AND”还是“OR”连词。有人知道如何解决这个问题吗？我看到示例显示依存关系“conj_and”和“conj_or”，但我没有看到它们来自

1热度

1回答

UIMA ruta WORDTABLE

我尝试运行WORDTABLE示例here。但是我得到了一个错误。以下是代码： WORDTABLE presidentsOfUSA = 'presidentsOfUSA.csv'; DECLARE Annotation PresidentOfUSA(STRING party, INT yearOfInauguration); Document{->MARKTABLE(PresidentOfUSA