pandas-groupby

    0热度

    1回答

    我需要根据数两列进行排序并键入 881 X 497Ÿ 2400 X 2559Ÿ 2556ž 1748 x 443 y 217ž 1024ÿ 当前代码段: import pandas as pd data1 = pd.read_csv('data/extracted.csv') data2 = data1.sort(['Result7d'], ascending=True)

    1热度

    1回答

    我正在使用熊猫来分析我的数据。我有这个数据帧elapsed_seconds和m(幅度)。有没有办法让我分组 - 浮点数的五位数(elapsed_seconds)并找到m的平均值? 例子: elapsed_seconds,m 10769.001,0.373637934043 10769.027,0.373403294813 10769.041,0.373069383556 10769.061

    3热度

    2回答

    我常常最终会做这样的事情在pandas: s2 = s1.groupby(level=1).sum() s2 = s2[s2>25] 在的话,我做了一些groupby操作,然后只保留满足的结果一定条件下的结果。 在一行中有办法吗?更具体地说,是否可以在不创建系列的情况下执行此操作,然后在第二步中执行布尔选择?

    0热度

    1回答

    我已经在pandas中使用了groupby,但组的标签只是一个任意值,而我希望这个标签是索引的原始数据帧(这是datetime),以便我可以创建一个新的数据帧,我可以根据日期时间进行绘图。 grouped_data = df.groupby( ['X',df.X.ne(df.X.shift()).cumsum().rename('grp')]) grouped_data2

    1热度

    2回答

    我正在寻找合并多行不同dtypes的熊猫。我有我的.groupby()参数:['ID']。当按['ID']分组时,列['A']可能重复值,或者每行的数据不同。仅需要通过.sum()汇总列['B']。 input_df ID A B 140-1 Apple 3.2 140-1 Pear 5.0 143-2 Plum 1.2 143-2 Plum 2.0 什么是由['ID'

    1热度

    1回答

    我有以下通用格式的数据,我想重新取样到30天有一系列窗口: 'customer_id','transaction_dt','product','price','units' 1,2004-01-02,thing1,25,47 1,2004-01-17,thing2,150,8 2,2004-01-29,thing2,150,25 3,2017-07-15,thing3,55,17 3,2

    1热度

    2回答

    我想将用户交易汇总到熊猫的列表中。我无法弄清楚如何制作一个由多个字段组成的列表。例如, df = pd.DataFrame({'user':[1,1,2,2,3], 'time':[20,10,11,18, 15], 'amount':[10.99, 4.99, 2.99, 1.99, 10.99]}) 它看起来像 amount time user 0 1

    0热度

    1回答

    我有这个数据集被称为 '事件' id event_type_1 event_type_2 event_type_3 234 0 1 0 234 1 0 0 345 0 0 0 ,我想生产这种 id event_type_1 event_type_2 event_type_3 234 1 1 0 345 0

    1热度

    1回答

    我有以下数据框: payment_method_id payment_plan_days plan_list_price actual_amount_paid date msno YyO+tlZtAXYXoZhNr3Vg3+dfVQvrBVGO8j1mfqe4ZHc= 41 30 129 129 2015-01-01 AZtu6Wl0gPojrEQYB8Q3vBSmE2wnZ

    13热度

    1回答

    这是对this one的后续问题,其中jezrael使用pandas.DataFrame.groupby将列表创建的速度增加了几百倍。具体而言,让df是大的数据帧,然后 index = list(set(df.index)) list_df = [df.loc(x) for x in index] 和 list_df = [x for i,x in df.groupby(level=0, s