uima

    2热度

    1回答

    我们有一个带有多个独立注释器的UIMAFit管道,寻找并行执行它们的方法。请建议。 如何以下方法 1)通过分组注释 2创建多个分析引擎)从池中获取JCAS的情况下,用相同的文字初始化。 3)使用java线程执行器框架并行运行分析引擎。 4)合并Jcas

    0热度

    1回答

    我正在使用DeepLearning4Java的修改版来使用UIMA CollectionReader处理文档。对于大型文档集合,我遇到了GC开销限制错误或不同类型的TimeOut错误(例如线程“RMI TCP连接(空闲)”中的异常),因为垃圾收集花费更多时间。我不确定这是内存泄漏还是我在工作人员邮箱中堆积太多工作。我不熟悉scala和akka,但这并没有帮助。 会发生什么情况是我的应用程序运行良好

    3热度

    1回答

    在UIMA中,CAS(通用注释结构)在构建NLP应用程序中起着重要作用。它允许将组件添加到下一个组件的元数据。例如,来自句子标记器的句子边界可以被添加到CAS并被随后的词标记器使用。 NLTK中的等效数据结构是什么?

    3热度

    1回答

    我研究的默认UIMA鲁塔工作台Eclipse项目足以显著了解它的运动部件 - 例如,为什么input/和output/文件夹,表现为他们做什么,如何使用jcasgen和其他Maven插件完成项目等 但是即使经过几个小时的学习项目并与Maven一起试图使其运行起来,我仍然遇到了很多麻烦:使用Ruta脚本中的DKPro库(特别是类型)。 我的根本问题是这样的:在Ruta脚本中使用DKPro和TC库中的

    2热度

    1回答

    我有几个关于UIMA Ruta TextRuler的问题。 是否有可能(我认为它应该是)在Eclipse GUI之外使用TextRuler?如果是这样,则可以提供调用它包括以下参数的GUI的外侧的一个例子(因为它们是被提供给GUI为TextRuler,相同的): 训练数据文件夹 附加数据文件夹(这是什么?) 测试数据文件夹 评估测试数据 预处理脚本文件 跳过预处理脚本文件种 信息类型,以尝试提取

    2热度

    1回答

    如何使用UIMA和JCas访问文档元数据,如创建和修改日期或标题等?

    2热度

    1回答

    我可以访问使用Ruta脚本定义为基本类型的功能。 例如,posTag是TokenAnnotation的字符串功能。以下脚本起作用。 STRING str1,str2;TokenAnnotation { - > GETFEATURE(“posTag”,str1),LOG(“posTag =”+ str1)}; 但是,我无法读取定义为另一个Annotation类型的功能。 TokenAnnotatio

    0热度

    1回答

    我正在开发Apache UIMA + Apache Solr集成。首先我已将Apache UIMA与eclipse集成。我在eclipse中实现了NOUN短语注释器,并且运行了几个例子。 它工作得很好,并通过查找名词来给出准确的结果。 现在我试图用Solr实现UIMA。我也跟着下面的链接是相同的: https://wiki.apache.org/solr/SolrUIMA 我已出口工作的Eclip

    0热度

    1回答

    我正在使用UIMA与UIMAfit和dkpro以及StanfordParser一起解析英语句子。 我可以毫无问题地构建依赖关系树。对于“和”/“或”连词,我得到了CONJ类的注释,这是Dependency的一个子类。截至目前,我没有发现,如何检查找到的连词是“AND”还是“OR”连词。 有人知道如何解决这个问题吗?我看到示例显示依存关系“conj_and”和“conj_or”,但我没有看到它们来自

    1热度

    1回答

    我尝试运行WORDTABLE示例here。但是我得到了一个错误。以下是代码: WORDTABLE presidentsOfUSA = 'presidentsOfUSA.csv'; DECLARE Annotation PresidentOfUSA(STRING party, INT yearOfInauguration); Document{->MARKTABLE(PresidentOfUSA