summarization

    -4热度

    1回答

    我有一个数据框--say x - 提供一个函数,该函数根据列x $ id的值返回一个子集。 该子集y包含一列y $房间,其中包含取决于x $ id值的不同值的混合。 然后用tidyr传播该子集,并且y $房间的值成为列。 然后生成的扩展df --say ext_y--必须按列y_ext $ visit进行分组,并且应通过特殊函数为其余列计算汇总统计。 显而易见的问题是,这些列并未预先知道,因此无法

    1热度

    2回答

    我正在研究DBpedia实体摘要项目。我首先想要创建一个名为SUMMARUM的项目API。在这个项目中笔者提出两个部分:客户端部分和服务器应用程序的一部分: 服务器端:https://github.com/athalhammer/summaServer 客户端:https://github.com/athalhammer/summaClient 现在,我阅读有关servlet的一些教程旨在发展一个

    -1热度

    1回答

    我使用R language的帮助获得长文本文件我想在至少10至20行或小句子中总结文本。 如何使用R language至少10行总结文本?

    1热度

    1回答

    我有一长串列,我想计算非零中位数,意味着& std在一次去。我不能只删除基于1列的0行,因为同一列中另一列的值可能不是0. 下面是我目前使用的计算中位数,平均值等的代码,包括零。 agg_list_oper={'ABC1':[max,np.std,np.mean,np.median], 'ABC2':[max,np.std,np.mean,np.median], 'ABC3':

    1热度

    1回答

    我在阅读一篇研究论文Automatic Text Document Summarization Based on Machine Learning,并且在表1中对应于基于图的权重,他们已经使用了称为聚集相似性的特征F1。 我曾尝试在网上搜索,但我已经找到提到的东西像“柔性骨料相似”,但不敢肯定它是如何涉及到自动汇总和称重句子的任务。 究竟是由骨料相似的意思,它是如何计算出来的?

    -3热度

    2回答

    我想就有关文本摘要不同的任务工作: 话题/关键词提取 句子抽取 什么英语corporus存在于这个任务就是要帮助?

    1热度

    4回答

    这是一个新手问题,但是,我发现很难理解如何正确使用lapply,特别是当使用的ID不是数字时。 有可能更好的方法来试图找到我想到的总结,但现在,我试图使用lapply。基本上,我有一个17列大DF。两列是ID和日期。并非所有的ID在给定的列名称中都有记录的值。我感兴趣的是查找每列可用的总行数,以及该列存在的唯一ID的数量。我有一个让事情变得更清晰的例子。例如,Var8只有6行数据可用,因此它有6个

    0热度

    1回答

    我试图组织一个数据集与同一位置的多个副本的唯一位置。另外,我只想保留每个位置条目的最大丰度报告。这是数据集的前6行。注意3和4的位置是相同的,所以我想放弃第3行并保留第4行,因为它具有更高的丰度。第5行和第6行的丰度最高,但我只需要保留其中一个。 X abun location 1 1 L2507550 2 1 L668283 3 1 L831877 4 5 L831877 5

    0热度

    1回答

    目前我正在进行文本摘要。我计划使用神经网络来生成给定文本的抽取摘要。哪种类型的神经网络适合文本分类。

    0热度

    3回答

    我需要显示发票每一行的序列号。这意味着,在一个位置上可以有多个序列号。随着序列号,需要一个数量,这显然是一个数字。不幸的是,可能会有比序列号更多的项目。在发货过程中未扫描序列号时会发生这种情况。在我的输出中,我需要为这些位置额外添加一行,以显示REMAINING项目的数量。因此,假设有一个包含10个物品的位置,并且在发货过程中只扫描了4个物品。这意味着我打印四行连续和数量一和一行没有连续和数量六。