pandas-groupby

0热度

1回答

我需要根据数两列进行排序并键入 881 X 497Ÿ 2400 X 2559Ÿ 2556ž 1748 x 443 y 217ž 1024ÿ 当前代码段： import pandas as pd data1 = pd.read_csv('data/extracted.csv') data2 = data1.sort(['Result7d'], ascending=True)

1热度

1回答

将浮点过滤为数字的大熊猫

我正在使用熊猫来分析我的数据。我有这个数据帧elapsed_seconds和m（幅度）。有没有办法让我分组 - 浮点数的五位数（elapsed_seconds）并找到m的平均值？例子： elapsed_seconds,m 10769.001,0.373637934043 10769.027,0.373403294813 10769.041,0.373069383556 10769.061

3热度

2回答

大熊猫GROUPBY和布尔选择

我常常最终会做这样的事情在pandas： s2 = s1.groupby(level=1).sum() s2 = s2[s2>25] 在的话，我做了一些groupby操作，然后只保留满足的结果一定条件下的结果。在一行中有办法吗？更具体地说，是否可以在不创建系列的情况下执行此操作，然后在第二步中执行布尔选择？

0热度

1回答

Python Pandas - 将索引作为组的名称/索引生成数据框

我已经在pandas中使用了groupby，但组的标签只是一个任意值，而我希望这个标签是索引的原始数据帧（这是datetime），以便我可以创建一个新的数据帧，我可以根据日期时间进行绘图。 grouped_data = df.groupby( ['X',df.X.ne(df.X.shift()).cumsum().rename('grp')]) grouped_data2

1热度

2回答

分组行和定义列聚合规则

我正在寻找合并多行不同dtypes的熊猫。我有我的.groupby()参数：['ID']。当按['ID']分组时，列['A']可能重复值，或者每行的数据不同。仅需要通过.sum()汇总列['B']。 input_df ID A B 140-1 Apple 3.2 140-1 Pear 5.0 143-2 Plum 1.2 143-2 Plum 2.0 什么是由['ID'

1热度

1回答

Python的大熊猫：重新取样多元时间序列与GROUPBY

我有以下通用格式的数据，我想重新取样到30天有一系列窗口： 'customer_id','transaction_dt','product','price','units' 1,2004-01-02,thing1,25,47 1,2004-01-17,thing2,150,8 2,2004-01-29,thing2,150,25 3,2017-07-15,thing3,55,17 3,2

1热度

2回答

Pandas：groupby列A并使其他列的元组列表？

我想将用户交易汇总到熊猫的列表中。我无法弄清楚如何制作一个由多个字段组成的列表。例如， df = pd.DataFrame({'user':[1,1,2,2,3], 'time':[20,10,11,18, 15], 'amount':[10.99, 4.99, 2.99, 1.99, 10.99]}) 它看起来像 amount time user 0 1

0热度

1回答

熊猫群由此改变了关键，为什么？

我有这个数据集被称为 '事件' id event_type_1 event_type_2 event_type_3 234 0 1 0 234 1 0 0 345 0 0 0 ，我想生产这种 id event_type_1 event_type_2 event_type_3 234 1 1 0 345 0

1热度

1回答

如何引用熊猫数据框的索引字段？

我有以下数据框： payment_method_id payment_plan_days plan_list_price actual_amount_paid date msno YyO+tlZtAXYXoZhNr3Vg3+dfVQvrBVGO8j1mfqe4ZHc= 41 30 129 129 2015-01-01 AZtu6Wl0gPojrEQYB8Q3vBSmE2wnZ

13热度

1回答

为什么groupby这么快？

这是对this one的后续问题，其中jezrael使用pandas.DataFrame.groupby将列表创建的速度增加了几百倍。具体而言，让df是大的数据帧，然后 index = list(set(df.index)) list_df = [df.loc(x) for x in index] 和 list_df = [x for i,x in df.groupby(level=0, s