我有一个熊猫数据框,其中一列表示另一列中的位置值是否在其下面的行中发生了变化。作为一个例子,遍历熊猫数据框
2013-02-05 19:45:00 (39.94, -86.159) True
2013-02-05 19:50:00 (39.94, -86.159) True
2013-02-05 19:55:00 (39.94, -86.159) False
2013-02-05 20:00:00 (39.777, -85.995) False
2013-02-05 20:05:00 (39.775, -85.978) True
2013-02-05 20:10:00 (39.775, -85.978) True
2013-02-05 20:15:00 (39.775, -85.978) False
2013-02-05 20:20:00 (39.94, -86.159) True
2013-02-05 20:30:00 (39.94, -86.159) False
所以,我想要做的是去逐行通过这个数据帧,并与False
检查行。然后(可能会添加另一列),在那个地方总共花费了“连续”时间。像上面的例子一样,可以再次访问同一个地方。在这种情况下,它被认为是一个单独的条件。所以,上面的例子中,是这样的:
2013-02-05 19:45:00 (39.94, -86.159) True 0
2013-02-05 19:50:00 (39.94, -86.159) True 0
2013-02-05 19:55:00 (39.94, -86.159) False 15
2013-02-05 20:00:00 (39.777, -85.995) False 5
2013-02-05 20:05:00 (39.775, -85.978) True 0
2013-02-05 20:10:00 (39.775, -85.978) True 0
2013-02-05 20:15:00 (39.775, -85.978) False 15
2013-02-05 20:20:00 (39.94, -86.159) True 0
2013-02-05 20:25:00 (39.94, -86.159) False 10
我会然后绘制的使用每天HIST()函数花这些“持续”时间的直方图。如何通过遍历数据框从第一个数据帧中获取第二个数据帧?我是python和熊猫的新手,真正的数据文件非常庞大,所以我需要一些相当高效的东西。
非常好! – John