我有一个熊猫数据框,看起来像 Name Date Value
Sarah 11-01-2015 3
Sarah 11-02-2015 2
Sarah 11-03-2015 27
Bill 11-01-2015 42
Bill 11-02-2015 5
Bill 11-03-2015 15
.... (a couple hundred rows)
我怎
我使用Python3和pandas版本'0.19.2'。 我有一个熊猫DF如下: chat_id line
1 'Hi.'
1 'Hi, how are you?.'
1 'I'm well, thanks.'
2 'Is it going to rain?.'
2 'No, I don't think so.'
我想组由“chat_id”,然后做一些像“线”滚动
我有以下形式的熊猫数据帧: import pandas as pd
df = pd.DataFrame({
'a': [1,2,3,4,5,6],
'b': [0,1,0,1,0,1]
})
欲组由“B”的值的数据,并添加新的列“C”,其包含一个为每个组滚动总和'a',然后我想将所有组重新组合成一个包含'c'列的未分组的DataFrame。只要我有: for i, g
ID Year Firm Score
1 2005 A 2
1 2006 A 5
1 2006 B 1
1 2007 A 36
1 2007 E 69
1 2008 E 8
1 2008 B 54
1 2009 A 25
1 2009 C 2
1 2010 E 2
1 2010 B 2
1 2011 A 5
1 2011 B 5
1 2012 A 4
1 2012
我有一个数据框与多个索引,并希望创建一些数据的滚动总和,但索引中的每个ID。 例如,让我们说我有两个指标(商行和年),我有名字ZDATA一些数据。下面的工作示例如下: import pandas as pd
# generating data
firms = ['firm1']*5+['firm2']*5
years = [2000+i for i in range(5)]*2
zdat
我有一个不规则的时间序列,我试图用与R相关的每个与ID有关的操作的3个月窗口的滚动总和来计算。 数据结构如下 ID Operation date value
A 1 01/01/2017 0
A 2 01/02/2017 1
A 3 01/06/2017 1
A 4 01/09/2017 0
B 1 01/03/2017 0
B 2 0