summarization

-4热度

1回答

我有一个数据框--say x - 提供一个函数，该函数根据列x $ id的值返回一个子集。该子集y包含一列y $房间，其中包含取决于x $ id值的不同值的混合。然后用tidyr传播该子集，并且y $房间的值成为列。然后生成的扩展df --say ext_y--必须按列y_ext $ visit进行分组，并且应通过特殊函数为其余列计算汇总统计。显而易见的问题是，这些列并未预先知道，因此无法

1热度

2回答

客户端和服务器端应用程序之间的通信

我正在研究DBpedia实体摘要项目。我首先想要创建一个名为SUMMARUM的项目API。在这个项目中笔者提出两个部分：客户端部分和服务器应用程序的一部分：服务器端：https://github.com/athalhammer/summaServer 客户端：https://github.com/athalhammer/summaClient 现在，我阅读有关servlet的一些教程旨在发展一个

-1热度

1回答

R语言中的文本摘要

我使用R language的帮助获得长文本文件我想在至少10至20行或小句子中总结文本。如何使用R language至少10行总结文本？

1热度

1回答

如何找到熊猫多列的非零中值/平均值？

我有一长串列，我想计算非零中位数，意味着& std在一次去。我不能只删除基于1列的0行，因为同一列中另一列的值可能不是0. 下面是我目前使用的计算中位数，平均值等的代码，包括零。 agg_list_oper={'ABC1':[max,np.std,np.mean,np.median], 'ABC2':[max,np.std,np.mean,np.median], 'ABC3':

1热度

1回答

自动摘要中基于图的基于加权的语句提取？

我在阅读一篇研究论文Automatic Text Document Summarization Based on Machine Learning，并且在表1中对应于基于图的权重，他们已经使用了称为聚集相似性的特征F1。我曾尝试在网上搜索，但我已经找到提到的东西像“柔性骨料相似”，但不敢肯定它是如何涉及到自动汇总和称重句子的任务。究竟是由骨料相似的意思，它是如何计算出来的？

-3热度

2回答

是否有自动文本摘要的语料库？

我想就有关文本摘要不同的任务工作：话题/关键词提取句子抽取什么英语corporus存在于这个任务就是要帮助？

1热度

4回答

使用lapply的数据集摘要

这是一个新手问题，但是，我发现很难理解如何正确使用lapply，特别是当使用的ID不是数字时。有可能更好的方法来试图找到我想到的总结，但现在，我试图使用lapply。基本上，我有一个17列大DF。两列是ID和日期。并非所有的ID在给定的列名称中都有记录的值。我感兴趣的是查找每列可用的总行数，以及该列存在的唯一ID的数量。我有一个让事情变得更清晰的例子。例如，Var8只有6行数据可用，因此它有6个

0热度

1回答

使用dplyr总结与最大数量重复的组

我试图组织一个数据集与同一位置的多个副本的唯一位置。另外，我只想保留每个位置条目的最大丰度报告。这是数据集的前6行。注意3和4的位置是相同的，所以我想放弃第3行并保留第4行，因为它具有更高的丰度。第5行和第6行的丰度最高，但我只需要保留其中一个。 X abun location 1 1 L2507550 2 1 L668283 3 1 L831877 4 5 L831877 5

0热度

1回答

哪种类型的神经网络适合文本分类（提取摘要）

目前我正在进行文本摘要。我计划使用神经网络来生成给定文本的抽取摘要。哪种类型的神经网络适合文本分类。

0热度

3回答

用计算添加汇总列

我需要显示发票每一行的序列号。这意味着，在一个位置上可以有多个序列号。随着序列号，需要一个数量，这显然是一个数字。不幸的是，可能会有比序列号更多的项目。在发货过程中未扫描序列号时会发生这种情况。在我的输出中，我需要为这些位置额外添加一行，以显示REMAINING项目的数量。因此，假设有一个包含10个物品的位置，并且在发货过程中只扫描了4个物品。这意味着我打印四行连续和数量一和一行没有连续和数量六。