python熊猫从时间序列中提取独特的日期

我有一个DataFrame包含大量的盘中数据，DataFrame有数天的数据，日期不连续。python熊猫从时间序列中提取独特的日期

2012-10-08 07:12:22   0.0 0   0 2315.6 0  0.0 0 
2012-10-08 09:14:00   2306.4 20 326586240 2306.4 472 2306.8 4 
2012-10-08 09:15:00   2306.8 34 249805440 2306.8 361 2308.0 26 
2012-10-08 09:15:01   2308.0 1 53309040 2307.4 77 2308.6 9 
2012-10-08 09:15:01.500000 2308.2 1 124630140 2307.0 180 2308.4 1 
2012-10-08 09:15:02   2307.0 5 85846260 2308.2 124 2308.0 9 
2012-10-08 09:15:02.500000 2307.0 3 128073540 2307.0 185 2307.6 11 
...... 
2012-10-10 07:19:30   0.0 0   0 2276.6 0  0.0 0 
2012-10-10 09:14:00   2283.2 80 98634240 2283.2 144 2283.4 1 
2012-10-10 09:15:00   2285.2 18 126814260 2285.2 185 2285.6 3 
2012-10-10 09:15:01   2285.8 6 98719560 2286.8 144 2287.0 25 
2012-10-10 09:15:01.500000 2287.0 36 144759420 2288.8 211 2289.0 4 
2012-10-10 09:15:02   2287.4 6 109829280 2287.4 160 2288.6 5 
......

如何从上面的DataFrame中提取日期时间格式中的唯一日期？有一个像[2012-10-08, 2012-10-10]

来源

2013-02-03 tesla1060

如果你有Series，如：

In [116]: df["Date"] 
Out[116]: 
0   2012-10-08 07:12:22 
1   2012-10-08 09:14:00 
2   2012-10-08 09:15:00 
3   2012-10-08 09:15:01 
4 2012-10-08 09:15:01.500000 
5   2012-10-08 09:15:02 
6 2012-10-08 09:15:02.500000 
7   2012-10-10 07:19:30 
8   2012-10-10 09:14:00 
9   2012-10-10 09:15:00 
10   2012-10-10 09:15:01 
11 2012-10-10 09:15:01.500000 
12   2012-10-10 09:15:02 
Name: Date

其中每个对象是Timestamp：

In [117]: df["Date"][0] 
Out[117]: <Timestamp: 2012-10-08 07:12:22>

您可以通过调用.date()只得到日期：

In [118]: df["Date"][0].date() 
Out[118]: datetime.date(2012, 10, 8)

和系列有.unique()方法。所以，你可以使用map和lambda：

In [126]: df["Date"].map(lambda t: t.date()).unique() 
Out[126]: array([2012-10-08, 2012-10-10], dtype=object)

或使用Timestamp.date方法：

In [127]: df["Date"].map(pd.Timestamp.date).unique() 
Out[127]: array([2012-10-08, 2012-10-10], dtype=object)

来源

2013-02-03 14:41:41 DSM

感谢，虽然一个额外的问题，如果我做什么'Date'列是索引，'DF .index.map（pd.Timestamp.date）.unique（）'抛出''numpy.ndarray'对象没有属性'unique''错误 – tesla1060

@ tesla1060：您可以将其推回到'Series'中， pd.Series（df.index）.map等等。或者，如果顺序无关紧要，甚至可以使用set（df.index.map（pd.Timestamp.date））'。 – DSM

结果使用正则表达式：

(\d{4}-\d{2}-\d{2})

运行它re.findall函数来获取所有匹配：

result = re.findall(r"(\d{4}-\d{2}-\d{2})", subject)

来源

2013-02-03 14:32:18 iTayb

python熊猫从时间序列中提取独特的日期

回答

相关问题