summarization

    0热度

    2回答

    我正在尝试构建一个新闻中心应用程序,我的目标是从其他新闻频道中提取新闻文章,对其进行总结,并以无偏见的方式呈现子弹形式。 我已经开始运行算法,我需要的是从其他网站收集数据的代码,如NDTV,CNN等。 请给我一个如何执行此操作的描述。代码,链接,示例和屏幕截图会有很大的帮助。 谢谢! (Y)

    2热度

    2回答

    的边际摘要我正在与在“R转储”格式输出数据的系统的工作。例如,它可以输出一个三维数组看起来像这样: obs <- structure(c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24), .Dim=c(2,4,3)) 我是新于R,但我想用R检查这个数据的边际摘要。例如,我希望看到一个平均值在该三维平均

    2热度

    4回答

    我想总结或汇总表而不删除空的水平。我想知道有没有人对此有任何想法? 作为一个例子,在这里 是数据帧使用碱和doBy包 df1<-data.frame(Method=c(rep("A",3),rep("B",2),rep("C",4)), Type=c("Fast","Fast","Medium","Fast","Slow","Fast","Medium","Slow","Slow"),

    0热度

    1回答

    选择一些留字时,我想选择一个字段的100个字左右,我用这个语法: SELECT LEFT (text, LOCATE(' ', text, 100)-1) AS title FROM myTable 此查询有没有问题我。 但今天我想在一个Unicode文本上使用它,并且此查询无法正常工作。 例如:如果我的字段包含ماهي كيفية قضاء صوم رمضان الذي لم اصمه ؟作

    0热度

    2回答

    我的收藏包含随时间变化的货币汇率。我希望显示一个图表,并且我需要知道每个小时只有一个值。然而,我的数据更密集,每秒钟都有一个记录。 如何降低记录的密度,每小时只留下一个记录。我不需要平均,每个小时的任何记录就足够了。 { "_id" : ObjectId("52112613b45b5d057589009e"), "date" : ISODate("2013-08-18T19:5

    2热度

    2回答

    行的限定数目和每个的位置(从-1000到+1000)并且对于每个位置的计数。一个小例子看起来这本: dt.ex <- data.table(newID=rep(c("A","B"), each = 6), pos=rep(c(-2:3), 2), count= sample(c(1:100), 12)) newID pos count 1: A -2 29 2: A -1 32

    2热度

    2回答

    我是plyr的新手,想要在一个类中取值的加权平均值来重新构造多个变量的数据框。使用下面的代码,我知道如何为一个变量做到这一点,如X2: set.seed(123) frame <- data.frame(class=sample(LETTERS[1:5], replace = TRUE), x=rnorm(20), x2 = rnorm(20), weights=rnorm(2

    2热度

    2回答

    我已经设置了所有参数,如http://kavita-ganesan.com/rouge-howto中所述。但是我得到了零值的精确回忆和f-1。请帮助我,我该怎么办?

    3热度

    2回答

    我尝试总结所有路径,尽管树是从根到最低的子节点之间的每个级别扩展1到10次。 我的函数对所有孩子都进行递归递归,但是我遇到这样的问题,当我尝试创建节点列表并在列表中执行此列表时,我将成为列表的列表列表...列表。 我认为我的问题是组合步骤而我试图做一个模式匹配方法,但应该比较列表,当它成为列表的列表的方法,并应该做出新的列表,并比较它们,如果它只是一种方式(符合与节点列表而不是列表与列表)不起作用

    3热度

    1回答

    我使用苏梅https://github.com/miso-belica/sumy为Python文本摘要 ,当我使用的HTMLParser我得到这个错误。 Traceback (most recent call last): File "", line 1, in File "/usr/local/lib/python2.7/dist-packages/sumy/parsers/html.py"