到数据帧里面添加字典列表作为新列

比方说，我有以下的熊猫数据框：到数据帧里面添加字典列表作为新列

df = pd.DataFrame({'x': [0, 1, 2], 'y': [3, 4, 5], 'z': [6, 7, 8]}) 
    x y z 
0 0 3 6 
1 1 4 7 
2 2 5 8

而下面的词典：

d = {'a': [10, 10, 10], 'b': [100, 100, 100]}

什么是添加字典到的最好办法DataFrame得到以下内容：

 x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100

这就是我到目前为止，但我觉得在那里必须是更好的方法：

df_bigger = pd.concat([df, pd.DataFrame(d)], axis=1)

来源

2017-05-24 Johnny Metz

使用assign与字典拆包

df.assign(**d) 

    x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100

注意与assign只要列表的长度与数据帧一致的，那么指数的照顾。

来源

2017-05-25 00:40:43 piRSquared

'** d'是什么意思/做什么？ –

**解包字典并将其作为要分配的关键字参数传递。这正是需要添加额外的列 – piRSquared

您可以使用join（）。正如评论中提到的@piRsquared，传递索引如下。

df = df.join(pd.DataFrame(d, index = df.index)) 

    x y z a b 
0 0 3 6 10 100 
1 1 4 7 10 100 
2 2 5 8 10 100

来源

2017-05-24 23:44:46 Vaishali

加一个从我。另外，需要在构造函数中包含df索引，否则如果df没有默认值，将失败 – piRSquared

@piRSquared，谢谢:)我通过更改df的索引来测试它，它返回a和b中的所有NaN。你太棒了！ – Vaishali

一种方法是做到这一点：

dataframe_dict = pd.DataFrame.to_dict(orient='dict') 
d = {'a': [10, 10, 10], 'b': [100, 100, 100]} 

new_dict = dict(dataframe_dict.items() + d.items())

BTW，我从来没有使用过DataFrames，但在这里：https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_dict.html，它说，你可以转换一个数据帧与dict，所以我只是把它转换，并创建了包含其他项目的新词典。

来源

2017-05-24 23:50:59 pauloaap

#merge existing data with the new dict and re-construct a DF. 
pd.DataFrame(dict(df.to_dict(orient='list'),**d)) 
Out[186]: 
    a b x y z 
0 10 100 0 3 6 
1 10 100 1 4 7 
2 10 100 2 5 8

来源

2017-05-25 13:22:01 Allen

虽然此代码可能回答这个问题，但提供关于如何和/或为何解决问题的额外上下文会提高答案的长期价值。 - [来自评论]（https://stackoverflow.com/review/low-quality-posts/16231518） –

到数据帧里面添加字典列表作为新列

回答

相关问题