2017-05-21 52 views
1

的数据集我有一个dataset.csv文件看起来像这样如何解析特性与用户特定的日期格式

time, cost,volume,valid 
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True 
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False 

你能帮分析该数据集这样的数据类型为:列1:日期,列2:浮动,栏3:浮动,column4:布尔

感谢 CG

回答

1

您可以使用read_csv与参数skipinitialspaceparse_dates

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""time, cost,volume,valid 
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True 
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False""" 
#after testing replace 'StringIO(temp)' to 'filename.csv' 
df = pd.read_csv(StringIO(temp), skipinitialspace=True, parse_dates=[0]) 
print (df) 
       time cost volume valid 
0 2017-05-19 10:00:00 9.1  3.2 True 
1 2017-05-19 11:03:09 5.2  4.2 False 

print (df.dtypes) 
time  datetime64[ns] 
cost    float64 
volume   float64 
valid    bool 
dtype: object 
+0

这真棒,谢谢jezrael –

+0

好吧,它与样品很好。它也适用于真实的数据? – jezrael