information-extraction

    0热度

    1回答

    的部分能否GATE批斜塔PR来可靠地识别电子邮件即只是一部分是写的发件人排除的“组成”部分 报价先前的对话, 签名 和标题(From,To,Date)。 目前,我认为问候(“亲爱的加里”)和封闭(“亲切的问候,约翰”)是组成文本的一部分。 我尝试过使用一小段手写的电子邮件和下面显示的配置进行培训。作为属性,我尝试了由默认ANNIE生成的注记类型Token,SpaceToken,Split,Date

    1热度

    1回答

    如何链接条款(关键字实体)其中有一些关系其中通过文本文件。示例是google当您搜索某个人时,它显示建议其他与该人相关的人。 在这张照片想通了配偶,总统候选人,并等于指定 我使用频率计数技术。 出现在同一文件中的越多,它们之间的关系就越有可能。但是,这也会在文本文档中链接无关的术语,如页面标记,动词和页面回复。 我应该如何改进它,是否还有其他简单但可靠的技术?

    0热度

    1回答

    我正在使用NLTK从英文文本中使用基于功能的cfg获取sql查询。我跟着这个链接http://www.nltk.org/book/ch10.html。我可以运行fcfg存储在sql0.fcfg文件中的示例。 之后,我试图修改它为我所用,我添加了以下新规则: % start S ## Added by me S[SEM=(?whadvp + ?sq)] -> WHADVP[SEM=?whadvp

    0热度

    1回答

    我已使用standfordNER分类器对文本进行分类。 这是代码。 string docText = fileContent; string txt = ""; var classified = Classifier.classifyToCharacterOffsets(docText).toArray(); for (int i = 0; i < class

    2热度

    1回答

    感兴趣的领域:信息抽取 这对我来说是非常新的,我试图理解如何设计特征(无论是词汇还是语义)以便学习信息抽取中的关系。 从报纸,简单的步骤采取两个命名实体之间的关系,为监督学习的特点之一是 * The sequence of words between the two entities * the part of speech tags of these words * bag of words

    0热度

    1回答

    我想通过输出图的包定义命令在闪亮的应用中实现一些分析。这个包定义的命令需要从单独的命令(指定给定数据矩阵中的哪些特定列将被评估 - 这些列包含关于单元类型的信息)的初步输入。 #ui.R uiactual <- dashboardPage( dashboardHeader(title="Project"), [dashboard sidebar....] dashbo

    1热度

    1回答

    我试图从句子中提取关系(三元组),并试图手动筛选斯坦福大学CoreNLP的依赖关系分析,并以此方式提取主 - 动 - 对象关系。 问题是你超越简单的一句话现在“我很高兴”,同位语短语,ccomp和xcomp复合动词和连词conj,发现关系变得更加复杂。 例如:“我的老师,鲍勃是一个伟大的老师”(我的老师,是伟大的老师)&(我的老师,是鲍勃) “我的朋友和我不喜欢跑步或跳跃“。 (我的朋友,不喜欢,

    0热度

    1回答

    戏言规则中的字典我有这样的场景: 我在(例如) 000.000.0001.000 VALUE1 000.000.0002.000 VALUE2 ... 000.010.0001.000 VALUE254 的文件格式的键值对的列表呈现信息使用表如下: SK1 | SK2 | SK3 | SK4 000 | 000 | 0001 | 000 的问题是,处理此表时,它变成 000

    -1热度

    2回答

    我在我的目录900个的文本文件,如下 每个文件包含的数据按以下格式在下面的图中可以看出 667869 667869.000000 580083 580083.000000 316133 316133.000000 11065 11065.000000 我想从每个文本文件中提取第四行并将值存储在数组中,欢迎任何建议

    3热度

    1回答

    转达我有,我想提取那些表达以下语义的句子的集合: 我喜欢意大利美食。 这样一个句子的结构和措辞有很多不同。一些例子: 我喜欢意大利,中国和印度的食物。 我喜欢的美食有中国,意大利和印度。 我喜欢的一些美食包括印度,意大利和中国。 我喜欢世界各地的各种美食,如意大利,中国和印度。 解决此问题的好方法是什么? 我不是NLP的专家。这里只是一些我能想到的: 找同义词“喜欢”和“美食”使用解析器(斯坦福或