information-extraction

    1热度

    4回答

    我正在研究一个基于PHP的购物应用程序。我有我知道代表相同产品的字符串列表。这些字符串可能包含完整的产品名称或其中的一部分(完整的产品名称通常是品牌+型号)。 我不知道什么是执行此产品名称提取的最佳方法。 例如,这里代表同一产品的字符串列表: TKG BOUILLOIRE TKG - JK 1008 RWD TKG JK 1008 RWD TKG KALORIK - JK 1008 RWD - B

    1热度

    1回答

    我有一些文档和一些概念的本体论。是否有任何框架可以自动从给定文档中提取这些概念并创建三元组?本体必须包含特殊属性? 我发现UIMA,但据我UIMA明白我只能做这样的事情: 创造一些字典,其保持协会与本体 使用这本字典有ConceptMapper 写一个CAS消费者,创建三元组,并坚持他们 - 我不喜欢这种方法,因为我必须保持同步从本体的概念和d字典。 可以使用UIMA不同,或者是否有任何高级框架可

    0热度

    1回答

    我正在构建一个接收来自多个CRM系统的电子邮件的Web服务。电子邮件通常包含文本状态,例如“已收到”或“已完成”以及免费文字评论。 传入电子邮件的格式是不同的,例如,一些系统调用状态“Status:ZZZZZ”和一些“Action:ZZZZZ”。自由文本有时出现在状态和事件之后。状态代码将被映射到我的系统解释并且评论也是必需的。 此外,我预计这些格式会随着时间的推移而变化,因此可能由客户通过Web

    -1热度

    2回答

    我有大约1000个本地存储在磁盘上的页面,其中包含类似于以下示例的内容。 <html> <body> <li>User Dave<sup><a href="" title="" onClick="" class="">?</a></sup></li> <li>UserID<sup><a href="" title="" onClick="" class="">?</a></sup>: 000

    4热度

    2回答

    我希望有人能指引我朝着正确的方向学习如何从一堆文本中分离出动作。 假设我有这样的文字 Drop off the dry cleaning, and go to the corner store and pick-up a jug of milk and get a pint of strawberries. Then, go pick up the kids from school. Fir

    0热度

    1回答

    在具有变量步长的集成过程中(具体地,使用ode113积分器),通过其加速度确定物体的位置,该加速度随时间存储在文件中(即,两列,一个是时间,另一个是加速)。但是,由于通过上述过程的集成步骤失败,因此加速度数据文件的行数多于位置数据的相应行数。我如何能够提取加速度数据的正确数据,并使用与位置数据文件相同的行为它创建一个新文件?

    0热度

    1回答

    我在寻找一种从文本中提取国际电话号码的方法。 换言之,输入下面的文本: “此测试+44(0)7961617600条孙卫注释转移到伦敦火车站(周一,4月25日)和平:45名+ 1名BM教练确认32( 02024 9948 7711 - Gaynor在4月23日之前需要重新确认。\ n \ n在第4天确认:2011年4月25日星期一(星期日,4月24日)“ 将输出: +44(0)7961617600

    2热度

    1回答

    这是我第一次涉足NLP,请原谅我的无知。我正在寻找一种方法从用户的社交档案中提取兴趣/爱好/爱好。这里是所有的利益/喜欢/爱好是大胆的例子: “我认为自己是一个非常不同的角色。我是一个专业的 摔跤手,但我会采取子弹为墙•电子。我训练像健身房一个人的种族屠杀机器,但我哭了 “世界末日,”我会前往爆炸到AC/DC,我很认真 考虑获得塞尔达传说纹身我是4 20友好。我 喜欢党它与兄弟会的人群中一个晚上,

    1热度

    3回答

    我想从HTML页面中提取文本块,并且正在使用boilerpipe来完成此操作。它适用于页面中的一个文本,但像博客这样的页面在页面中有多个文本。 我想提取所有文本,但将每个文本标识为单独的文本,而不是一个。 有一些图书馆可以做到这一点? 编辑:我使用Jsoup来解析HTML,但我不想做解析,但像页面中的boilerpipe做信息提取。我想测试其他类似的工具。

    3热度

    4回答

    我在过去几天一直在研究一个项目,并且在这个项目中有一个任务,我实际上不知道该怎么做,该项目包括分析网页以查找表征页面的标记。 嘿,好友,你是什么意思的标签?通过说标签我的意思是关键字,总结什么网页。例如在这里你写你自己的标签,这样人们可以发现你的问题更好。我正在谈论的是构建一个算法来分析网页,以便通过页面中的文本找到它的标签。 我开始从页面获取文本 - >完成 一般即时寻找一种方式来找到关键字得出