dataframe

    8热度

    2回答

    我想统计数据帧中某些词的出现次数。我知道使用“str.contains” a = df2[df2['col1'].str.contains("sample")].groupby('col2').size() n = a.apply(lambda x: 1).sum() 目前我使用上面的代码。有没有一种方法来匹配正则表达式并获得出现次数?在我的情况下,我有一个很大的数据框,我想匹配大约100个

    0热度

    2回答

    我有一个看起来像这样的金融数据的大数据帧: id Tradedate name hour open close 19897 2013-01-30 instrument1 1 18.01 13.50 19898 2013-01-30 instrument2 2 15.72 8.99 19899 2013-01-30 instrument3 3 12.80 11.42 19900 201

    0热度

    1回答

    假设我有一个数据帧x和一个包含数据帧y和z的2个数据帧L的列表。 创建包含dfs x,y和z的第三个列表M的最佳方式是什么? 我试过,但x的每列成为M. M = c(x,L) 的元素我敢肯定有一些简单的解决办法,我在这里失踪。

    0热度

    2回答

    我正在尝试根据data.frame中包含的值重新设计和“扩展”data.frame。下面是我开始与数据帧的结构: 开始结构: 'data.frame': 9 obs. of 5 variables: $ Delivery.Location : chr "Henry" "Henry" "Henry" "Henry" ... $ Price : num 2.97 2.96 2.91 2.85

    1热度

    2回答

    我有三个数据集。 组1: A B 23 12 34 81 13 45 11 23 组2: A B .34 1.1 .5 2.0 .4 1.8 设置3: A B -23 5 -3 0.1 .8 -2.3 -.6 1.4 4 3.2 现在我要创建一个数据帧作为下面的类型: A B Typ

    0热度

    2回答

    请允许我详细说明。基本上,我有一个有4列的数据框,其中一列有NA。当NA发生时,它们总是以组的形式出现。我正在循环遍历这个数据框,看着列。我想要做的就是尽快找到NA,我想在达到正常值之前,将该行的数据框与最后一次出现NA的行进行子集划分。 因此,举例来说,假设我们看看我的数据帧DF: C1 C2 C3 C4 C5 C6 R1 2 1 2 1 0 0 R2 2 2 1 1 0 0 R3 0 0

    44热度

    6回答

    我有以下的数据帧: df = pandas.DataFrame([{'c1':3,'c2':10},{'c1':2, 'c2':30},{'c1':1,'c2':20},{'c1':2,'c2':15},{'c1':2,'c2':100}]) 或者,在人类可读的形式: c1 c2 0 3 10 1 2 30 2 1 20 3 2 15 4 2 100 以下排序命令按预期工作: d

    1热度

    2回答

    假设我有两个数据帧: 数据帧1(我们称之为数据1):为数据1 V1 V2 1 "AB" 3 "XY" 5 "DH" 8 "ST" 7 "RE" 代码: V1 <- c(1,3,5,8,7) V2 <- c("AB","XY", "DH", "ST","RE") Data1 <- data.frame(V1,V2) 数据帧2(让我们称之为本DATA2): V1

    0热度

    2回答

    我有两个数据帧 - 一个是巨大(超过200万行)和一个较小(约30万行)。较小的数据框是较大数据框的一个子集。唯一的区别是较大的有一个额外的属性,我需要添加到较小的一个。 具体地,对于大的数据帧的属性(日期,时间,地址,标志)和用于小的数据帧的属性(日期,时间,地址)。我需要以某种方式将正确的相应标志值存入每行较小的数据帧中。 “合并”数据帧的最终大小应该与我的较小数据帧相同,从大数据帧中丢弃未使

    5热度

    2回答

    我想生产从old大单(多变量)一new数据帧 我使用cbind.data.frame功能,它是这样的 new <- cbind.data.frame(old$var1, old$var2, old$var3) str(new) 'data.frame': 100 obs. of 3 variables: $ old$var1 : num 为什么VAR1仍属于old$? 我想用刚