我目前正在研究一个Python /熊猫数据科学项目的乐趣。我正在查看的数据有一个日期列,其日期如下所示:2016-07-16。数据类型也是一个对象。我想要做的是遍历每个日期并从该行中提取数据。现在,某些行可能具有相同的日期,因为在该日期发生了两次单独的攻击。 (我正在查看恐怖主义数据。)我目前所做的事情如下:熊猫/ python和一个数据框中的列,使用日期
dates = []
start = 0;
while start < 300:
date = data.iat[start, 1]
dates.append(date)
start += 1
这会让我几乎想要什么。然而,我有两个问题,启动变量设置为0,但我不能去365,因为,就像我说的,每个日期可能有多个攻击。所以一年可能会有400次袭击。例如,我可以在2016年12月31日或2017年1月1日结束数据收集吗?基本上,是否有办法快速确定年复一年的攻击次数?感谢您的任何帮助!
哦,我会说,我是想是这样的:
newDate = pd.to_datetime(startdate) + pd.DateOffset(days=1)
或
data['Date']) + timedelta(days=1)
一个添加的日期在今年结束。没有得到我想要的加上,每天可能有不止一个条目。
进一步解释我能有这样的事情:
Date Deaths Country
2002-01-01 2 India
2002-01-02 0 Pakistan
2001-01-02 1 France
的数据具有约20,000点,我需要找到一种方法,在每年年底停止它。这是我的主要问题。我不能去365,因为在世界各地的同一天可能会有多次恐怖袭击。
这不是很清楚你想达到什么...你可以[post](http://stackoverflow.com/posts/39580450/edit)样本可重现的输入数据集(5-7行)和所需的数据集? – MaxU
我试图添加一点点。但是,只知道数据从2002-01-01开始,直到2016-07-23左右。因此,每次发生恐怖袭击时,数据都会记录下来。我知道我的解释并不好。我确实取得了一些进展,但主要的问题是在数据从一年到下一年流年之后结束。 –
假设这是你的问题:“是否有办法快速确定年复一年的攻击次数?”。我会尝试创建一个列,这是你的日期年,然后使用像groupby和count这样的内置熊猫功能。 – Leo