dataframe

8热度

2回答

我想统计数据帧中某些词的出现次数。我知道使用“str.contains” a = df2[df2['col1'].str.contains("sample")].groupby('col2').size() n = a.apply(lambda x: 1).sum() 目前我使用上面的代码。有没有一种方法来匹配正则表达式并获得出现次数？在我的情况下，我有一个很大的数据框，我想匹配大约100个

0热度

2回答

合并数据帧中的R

我有一个看起来像这样的金融数据的大数据帧： id Tradedate name hour open close 19897 2013-01-30 instrument1 1 18.01 13.50 19898 2013-01-30 instrument2 2 15.72 8.99 19899 2013-01-30 instrument3 3 12.80 11.42 19900 201

0热度

1回答

将数据帧与数据帧列表组合

假设我有一个数据帧x和一个包含数据帧y和z的2个数据帧L的列表。创建包含dfs x，y和z的第三个列表M的最佳方式是什么？我试过，但x的每列成为M. M = c(x,L) 的元素我敢肯定有一些简单的解决办法，我在这里失踪。

0热度

2回答

R data frame reshape，restructure，and/or merge

我正在尝试根据data.frame中包含的值重新设计和“扩展”data.frame。下面是我开始与数据帧的结构：开始结构： 'data.frame': 9 obs. of 5 variables: $ Delivery.Location : chr "Henry" "Henry" "Henry" "Henry" ... $ Price : num 2.97 2.96 2.91 2.85

1热度

2回答

r，在data.frame中添加一列

我有三个数据集。组1： A B 23 12 34 81 13 45 11 23 组2： A B .34 1.1 .5 2.0 .4 1.8 设置3： A B -23 5 -3 0.1 .8 -2.3 -.6 1.4 4 3.2 现在我要创建一个数据帧作为下面的类型： A B Typ

0热度

2回答

如何基于下一次出现在R中为数据框子集？

请允许我详细说明。基本上，我有一个有4列的数据框，其中一列有NA。当NA发生时，它们总是以组的形式出现。我正在循环遍历这个数据框，看着列。我想要做的就是尽快找到NA，我想在达到正常值之前，将该行的数据框与最后一次出现NA的行进行子集划分。因此，举例来说，假设我们看看我的数据帧DF： C1 C2 C3 C4 C5 C6 R1 2 1 2 1 0 0 R2 2 2 1 1 0 0 R3 0 0

44热度

6回答

如何使用来自多列的值对熊猫数据框进行排序？

我有以下的数据帧： df = pandas.DataFrame([{'c1':3,'c2':10},{'c1':2, 'c2':30},{'c1':1,'c2':20},{'c1':2,'c2':15},{'c1':2,'c2':100}]) 或者，在人类可读的形式： c1 c2 0 3 10 1 2 30 2 1 20 3 2 15 4 2 100 以下排序命令按预期工作： d

1热度

2回答

独特且非唯一列表

假设我有两个数据帧：数据帧1（我们称之为数据1）：为数据1 V1 V2 1 "AB" 3 "XY" 5 "DH" 8 "ST" 7 "RE" 代码： V1 <- c(1,3,5,8,7) V2 <- c("AB","XY", "DH", "ST","RE") Data1 <- data.frame(V1,V2) 数据帧2（让我们称之为本DATA2）： V1

0热度

2回答

合并2数据帧，丢弃不匹配的行

我有两个数据帧 - 一个是巨大（超过200万行）和一个较小（约30万行）。较小的数据框是较大数据框的一个子集。唯一的区别是较大的有一个额外的属性，我需要添加到较小的一个。具体地，对于大的数据帧的属性（日期，时间，地址，标志）和用于小的数据帧的属性（日期，时间，地址）。我需要以某种方式将正确的相应标志值存入每行较小的数据帧中。 “合并”数据帧的最终大小应该与我的较小数据帧相同，从大数据帧中丢弃未使

5热度

2回答

从旧数据框生成新的数据帧？

我想生产从old大单（多变量）一new数据帧我使用cbind.data.frame功能，它是这样的 new <- cbind.data.frame(old$var1, old$var2, old$var3) str(new) 'data.frame': 100 obs. of 3 variables: $ old$var1 : num 为什么VAR1仍属于old$？我想用刚