我有一个几乎是无限的水平CSV其中的变量是整个头铺展和我有很多重复的时间戳导致的情景是这样的:集团通过时间戳一个CSV文件 - 熊猫
+------------+------------+------------+------------+
| Timestamp | Variable1 | Variable2 | .... |
+------------+------------+------------+------------+
| 2017/02/12 | 20 | | |
| 2017/02/13 | 20 | | |
| 2017/02/14 | 30 | | |
| 2017/02/12 | | 5 | |
| 2017/02/13 | | 2 | |
| 2017/02/14 | | 10 | |
| ... | | | |
+------------+------------+------------+------------+
我米试图通过时间戳以串联得到这样的结果:
+------------+------------+------------+------------+
| Timestamp | Variable1 | Variable2 | .... |
+------------+------------+------------+------------+
| 2017/02/12 | 20 | 5 | |
| 2017/02/13 | 20 | 2 | |
| 2017/02/14 | 30 | 10 | |
+------------+------------+------------+------------+
林在大熊猫相对较新,但我觉得这可以轻松使用多个dataframes但即时通讯有一个小疑问分组单数据帧进行。任何人都可以帮我一把吗?非常感谢你!
变量太多了。我可以在括号中应用相同种类的df.columns [1:-1]吗? :) –
'df.set_index('Timestamp').groupby(level = 0).sum()。reset_index()' – piRSquared
@piRSquared,谢谢! – Vaishali