我有使用Data = pandas.read_csv
子集的数据帧与日期为'str`和NaN值在Python
其中一个数据帧的各列的是日期的数据帧,从.csv文件中提取,如'14/09/2015'
,数据类型为str
。
我需要创建一个子集,这是我使用方法:NewDataFrame = DataFrame['DatesColumn'][DataFrame['DatesColumn']==desired date]
但我有两个主要问题:
- 由于日期字符串,我曾尝试使用切片[-1 ]。但我得到的错误:
KeyError : -1L
我试图用这个代码选择2014:
NewDataFrame = DataFrame['DatesColumn'][DataFrame['DatesColumn'][-1]==4]
- 我已经空字段已导入作为nan值。如果我尝试执行
for
环路转换数据,我得到的错误:
TypeError: 'float' object has no attribute '__getitem__'
问:我如何子集数据(或清洁)的一年?
非常感谢。
它的工作!该列被转换为“数据类型”,我可以用比较运算符处理它。 nan值被转换成NaT值,所以我不必处理它们。有一件事仍然困扰着我。我尝试了'.fillna()'方法,但它不起作用。当pd.read_csv读取一个空字段时,我得到的nan值的类型是'float'。它不应该是numpy.float? – Pau