information-extraction

    1热度

    1回答

    维基百科具有关于任何主题的非结构化和结构化信息。我特别想要获得总是显示在文章右侧的结构化数据。此方包含不同的数据,你可以在下面的例子中看到: Country Turkey Region Central Anatolia Province Ankara Area • Capital City 2,516 km2 (971 sq mi) Elevation 938 m (3,077 ft)

    1热度

    1回答

    如何提取属性,我需要提取特定行的p属性在cox.zph函数的输出R. 把你的问题,我描述了我的问题如下,通过步骤用一个例子步骤: require('survival') # I create the simplest test data set test1 <- list(time=c(4,3,1,1,2,2,3), status=c(1,1,1,0,1,1,0),

    4热度

    4回答

    我需要一些帮助在R中实现HMM模块。我是R新手,并没有太多的知识。 所以我必须实现一个使用HMM的IE,我有两个文件夹与文件,一个与句子和另一个与我想学习每个句子相应的标签。 folder1 > event1.txt: "2013 2nd International Conference on Information and Knowledge Management (ICIKM 2013) wi

    -3热度

    1回答

    我正在尝试创建一个分析文本字符串以查看它是否包含数字值的方法。例如,给定以下字符串: 什么是2 * 2? 我需要确定以下信息: 的字符串包含一个数值:True 什么是数值,它包含:2(他们的任何人都应该做的函数返回真和我应该把每个2点的的位置串中在变量如最初2) 这里位置0是码余到目前为止有: Public Function InQuestion(question As String) As Bo

    10热度

    3回答

    什么是从自由文本中提取位置的推荐方法? 我能想到的是使用正则表达式规则,比如“位置中的单词...”。但是有没有比这更好的方法? 另外我可以想象有一个国家和城市名称的查找哈希表,然后比较每个从文本提取的标记到哈希表。 有没有人知道更好的方法? 编辑:我试图从推文文本中提取位置。因此,大量推文的问题也可能影响我对方法的选择。

    0热度

    2回答

    嗨,专家帮手, 这是我发布的第一个问题,我看到有其他问题收到的神话般的答案。我的问题在下面; 我想通过提供处理(例如FASTSNP网站)的网站,处理与DNA序列相关的查询(SNP:对每个SNP具有特定唯一ID的单核苷酸多态性)后给出的结果(输出)给定SNP的排名基础,并且能够将提取的结果存储在MySQL数据库中。有没有一种方法使用正则表达式或任何其他PHP和/或Perl(out命令这样做呢?谁能谁

    2热度

    1回答

    因此,我正在尝试编写一个greasemonkey脚本,以便在我的网络游戏中放置拼贴。我已经知道了拼贴拼贴,但为了扩展脚本,我需要将循环限制为移动次数。我想不通,从页面的HTML中提取此信息的最佳方式:我只是在寻找如何解决此兽指针 <h2>5</h2>Level:<font size="4px" color="red"> 1455</font><br><br>Moves:<font size="4p

    -3热度

    1回答

    我与美国农业部营养数据库,它的食物有以下描述的工作: 例如: Cheese, fontina Cheese, cheddar Cheese, cottage, lowfat, 2% milkfat Cheese, cottage, lowfat, 1% milkfat Apples, raw, with skin Apples, dried, sulfured, uncooked Ap

    10热度

    2回答

    它看起来很简单。但我很困惑。 文本挖掘和信息提取有什么区别?

    0热度

    1回答

    我目前正在尝试提取信息,例如来自商业文件的发件人或收件人如账单。这些文档是用ocr软件处理成xml文件的,所以它们用格式化特征进行了注释。我想通过使用发件人和收件人等功能手动添加一个类似的文档来提取新文档中的特定信息。 所以我的问题是,如果有一个学习或匹配算法,能够提取特定的数据通过比较只有一个或两个类似文件的例子。如果是的话:是否有某种Java框架能够做到这一点? 此致谢天谢地 maggu