2017-05-24 146 views
3

比方说,我有以下的熊猫数据框:到数据帧里面添加字典列表作为新列

df = pd.DataFrame({'x': [0, 1, 2], 'y': [3, 4, 5], 'z': [6, 7, 8]}) 
    x y z 
0 0 3 6 
1 1 4 7 
2 2 5 8 

而下面的词典:

d = {'a': [10, 10, 10], 'b': [100, 100, 100]} 

什么是添加字典到的最好办法DataFrame得到以下内容:

 x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100 

这就是我到目前为止,但我觉得在那里必须是更好的方法:

df_bigger = pd.concat([df, pd.DataFrame(d)], axis=1) 

回答

3

使用assign与字典拆包

df.assign(**d) 

    x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100 

注意与assign只要列表的长度与数据帧一致的,那么指数的照顾。

+0

'** d'是什么意思/做什么? –

+0

**解包字典并将其作为要分配的关键字参数传递。这正是需要添加额外的列 – piRSquared

3

您可以使用join()。正如评论中提到的@piRsquared,传递索引如下。

df = df.join(pd.DataFrame(d, index = df.index)) 

    x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100 
+1

加一个从我。另外,需要在构造函数中包含df索引,否则如果df没有默认值,将失败 – piRSquared

+0

@piRSquared,谢谢:)我通过更改df的索引来测试它,它返回a和b中的所有NaN。你太棒了! – Vaishali

1

一种方法是做到这一点:

dataframe_dict = pd.DataFrame.to_dict(orient='dict') 
d = {'a': [10, 10, 10], 'b': [100, 100, 100]} 

new_dict = dict(dataframe_dict.items() + d.items()) 

BTW,我从来没有使用过DataFrames,但在这里:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_dict.html,它说,你可以转换一个数据帧与dict,所以我只是把它转换,并创建了包含其他项目的新词典。

0
#merge existing data with the new dict and re-construct a DF. 
pd.DataFrame(dict(df.to_dict(orient='list'),**d)) 
Out[186]: 
    a b x y z 
0 10 100 0 3 6 
1 10 100 1 4 7 
2 10 100 2 5 8 
+0

虽然此代码可能回答这个问题,但提供关于如何和/或为何解决问题的额外上下文会提高答案的长期价值。 - [来自评论](https://stackoverflow.com/review/low-quality-posts/16231518) –