pandas-groupby

    1热度

    1回答

    我有一个数据框,我想计算一列的连续条目数并将计数记录在单独的变量中。这里有一个例子: ID Class 1 A 1 A 2 A 1 B 1 B 1 B 2 B 1 C 1 C 2 A 2 A 2 A 我希望每个组ID数连续类的数量,所以输出应该是这样的: ID Class Counts 1 A

    0热度

    1回答

    假设我有一个数据帧如下 In [6]: df.head() Out[6]: regiment company name preTestScore postTestScore 0 Nighthawks 1st Miller 4 25 1 Nighthawks 1st Jacobson 24 94 2 Nighthawks 2nd Ali 31

    0热度

    2回答

    我想了解熊猫群组,但我目前正在看到一些我不明白的行为。基本上,我有一个数据集,看起来像(仅头): userId movieId rating timestamp parsed_time 0 1 2 3.5 1112486027 2005-04-02 23:53:47 1 1 29 3.5 1112484676 2005-04-02 23:31:16 2 1 32 3.5 1112

    3热度

    2回答

    我的假设数据帧是 df = pd.DataFrame({'col1':[91,91,91,91,92,92,92,92], 'col2':[91,92]*4,'value':[10]*8}) df col1 col2 value 0 91 91 10 1 91 92 10 2 91 91 10 3 91 92 10 4 92 91 10 5 92 92

    0热度

    2回答

    得到的意思是我有一个纯文本文件看起来像这样: count=1 file_type=2007 app=smtp timestamp=2017-07-25 20:01:02.042000 count=2 file_type=jar app=http timestamp=2017-07-25 20:01:02.042000 count=4421 file_type=gzip app=http tim

    1热度

    2回答

    我有一个熊猫据帧像这样, dd = pd.DataFrame( {'name': ['abc','bcd','abc'], 'seconds': [75,77,90], }) 我需要秒列合并为同名行一个列表。 我能for循环做到这一点使用, names= list(set(dd['name'])) counter=[] for a in names: counter.appe

    0热度

    1回答

    我有以下的数据帧df: period remaining_et_months property_id beds 0 0 0 329 1 1 1 0 329 1 2 2 1 329 1 3 3 2 329 1 4 3 2 329 1 5 4 3 329 1 6 4 3 329

    1热度

    1回答

    query.when数据框是一个空的df,当groupby引发运行时waring时,然后获得另一个没有列的空白数据框。如何保留列? df = pd.DataFrame(columns=["PlatformCategory","Platform","ResClassName","Amount"]) print df 结果: Empty DataFrame Columns: [Platform

    0热度

    1回答

    我有一个数据框架结构从多年来的人口统计数据的CSV文件中派生而来。即,文件中的列是每月的时间间隔(1999-01,1999-02 ... 2016-12),并且行是世界上不同的人口中心(例如伦敦,多伦多,波士顿等): df = pd.DataFrame({'1999-01' : [100, 5000, 8000], '1999-02' : [200, 6000, 9000], '1999-03'

    1热度

    1回答

    我有一个日期和“结果”分组一个熊猫数据帧: api_logs.groupby([api_logs.index.date, 'Outcome']).size() Outcome 2017-04-22 Success 7 2017-04-24 Failure 32 Success 59 2017-04-25 Failure 23 Success 9