uima

    2热度

    1回答

    运行Ruta Script时CPU使用率过高。因此我打算使用GPU。是否需要执行任何额外的过程才能在GPU机器中运行脚本。否则容易有任何替代解决方案来降低CPU使用率 示例脚本: PACKAGE uima.ruta.example; ENGINE utils.PlainTextAnnotator; TYPESYSTEM utils.PlainTextTypeSystem; WORDLIS

    1热度

    1回答

    我需要注释空通道在document.I使用正则表达式模式annotate.But它也涵盖了非emptypassage 示例输入文件: <p class="MsoNormal"><a name="para10001">You can easily change the formatting</a></p> <p class="MsoNormal"><a name="para10002"> </a>

    1热度

    1回答

    注释A有3个特征,即名称,日期&索引。 注释B有3个特征,即名称,日期&索引。 将值分配给除了B.index之外的所有功能。该名称的& B的&日期,我想分配给A.index B.index 输出示例: A annotaion: Wardlaw name:Wardlaw date:2003 index:3 Rahul name:R

    2热度

    1回答

    示例脚本: DECLARE Name,TEST; "Peter"->Name; "der Groot"->Name; "Robert"->Name; "de Leew"->Name; "O'Sullivan"->Name; STRING s; STRINGLIST slist; Name{-> MATCHEDTEXT(s), ADD(slist,s),LOG(s)};

    0热度

    1回答

    我使用Markfast如下 脚本: WORDLIST PARTICLESLIST = 'NameswithParticles.txt'; DECLARE PARTICLES; Document{ -> MARKFAST(PARTICLES, PARTICLESLIST,true)}; NameswithParticles.txt: der Der de De d' D' De

    2热度

    1回答

    我有一个输入字符串(例如'abcdefgh'),我需要的是用该字符串的一部分(例如'cd')进行注释,在其他我需要对输入字符串进行子串处理并用它标记注释。我怎样才能做到这一点?

    1热度

    1回答

    我想匹配一些条款只有当这个词背后的术语与我有关。所以,我创建了一个小例子: 这是我的测试数据: small Large Large small 我想庆祝的条款小大和大而不是“小”。 所以我想,这样的事情应该工作: DECLARE Test; (SW*? CW) {-> CREATE(Test)}; 但RUTA只匹配 “小大”。 对于测试我用“W”取代了“SW”,它会做我想做的事。

    2热度

    1回答

    我正在使用RUTA并为提取相同的实体写了很多不同的规则。例如,我将提取“卫生纸工厂”。目前我的规定将导致卫生纸厂,造纸厂和工厂。但我只对最长的比赛感兴趣。 我创建了一个小例子: DECLARE Test; (CW CW) {-> CREATE(Test)}; (CW CW CW) {-> CREATE(Test)}; 我的测试字符串:以上 lower lower Upper Upper U

    1热度

    1回答

    在运行UIMA Ruta脚本时,我经常会遇到类似这样的错误。为什么这样 ?我能做些什么来防止它? 它取决于我的代码还是与Eclipse IDE相关? 错误: 编辑器无法初始化。 org.apache.uima.UIMARuntimeException at org.apache.uima.util.CasIOUtils.load(CasIOUtils.java:368) at org.apac

    1热度

    1回答

    目的: 要分配的标题级别。 第一个标题是分配的级别1.我提取字体系列和它的大小,寻找匹配的标题。一旦级别被分配,我取消标题的标题,在另一个注释(HeadingHierarchy)中保留标题&。等级完成后,只要Headinglevel注释中剩下任何标题,就会一次又一次调用同一个块。 问题: 该脚本工作正常,发现所有1级标题。但是,当通过Call语句执行该块时,它仅找到每个级别的第一个匹配(级别2以上