2016-04-15 243 views
0

我在Kaggle上使用Python进行泰坦尼克号灾难竞赛。数据集(df)包含与每位乘客相对应的3个属性 - '性别'(1/0),'年龄'和'Pclass'(1/2/3)。我想获得与每个Gender-Pclass组合相对应的中位年龄。Python 3.x - 合并熊猫数据帧

最终的结果应该是一个数据帧作为 -

Gender Class 
1  1 
0  2 
1  3 
0  1 
1  2 
0  3 

年龄中位数将在稍后计算

我试图创建的数据帧如下 -

unique_gender = pd.DataFrame(df.Gender.unique()) 
unique_class = pd.DataFrame(df.Class.unique()) 

reqd_df = pd.merge(unique_gender, unique_class, how = 'outer') 

但产量获得的是 -

0 
0 3 
1 1 
2 2 
3 0 

有人可以帮我获得所需的输出吗?

+0

你想要的东西像'df.groupby([ '性别', '阶级'])[ '年龄']。中位数()' – JohnE

回答

0

你想(每副结核病)df.groupby(['gender','class'])['age'].median()