我有不同的尺寸就这样两个不同的数据帧:合并,总和和删除重复与熊猫
df_web = (['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value'])
df_app = (['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value']
我用熊猫尝试在“df_final”合并它们,但我想总结具有相同'ID'的'Total Events'的值,最后我希望在ID中有一个没有重复的'df_final'。
我想:
df_final_analysis = df_web.groupby(['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value'],
as_index=False)['Total Events'].sum()
但它不给我我想要的结果。
例如:
df_web
Video A 10
Video B 5
Video C 1
Video F 1
Video G 1
Video H 1
对于df_app:
Video A 15
Video D 3
Video C 1
因为我想df_final_analysis:
Video A 25
Video B 5
Video D 3
Video C 2
Video F 1
Video G 1
Video H 1
是否有一个优雅的方式来做到这一点?从使用pd.concat代码
请提供[MCVE]。 – IanS
我试图用一个例子来改进问题。谢谢。 – Thabra
@Thabra真的 - 'df_ *'变量根本不是数据框,而是列表;第二个甚至没有正确分隔。 –