我有各种时间序列的数据框,其中数据从各个时间点开始。因此,具有相同的起点,他们都填充为NaN
,就像这样:NaN的数据框的平均值为零,而不是NaN
location townA townB
datanumber 1234 1235
1940-01-01 NaN NaN
1940-02-01 NaN NaN
1940-03-01 NaN NaN
1940-04-01 NaN NaN
1940-05-01 0.53 NaN
我需要获得平均为我所有的位置,因此它看起来像meandf = locdf.mean(axis = 1)
应该做的工作。该documentation for pd.mean()
告诉我,
skipna : boolean, default True
Exclude NA/null values. If an entire row/column is NA, the result will be NA
它跳过NA值(这是一样的喃?),就像熊猫的所有其他功能做的,所以我希望像
1940-01-01 NaN
1940-02-01 NaN
1940-03-01 NaN
1940-04-01 NaN
1940-05-01 0.53
结果但我得到
1940-01-01 0
1940-02-01 0
1940-03-01 0
1940-04-01 0
1940-05-01 0.53
其肆虐之后,因为一切都在大熊猫其他人似乎与NaN
很好地工作,因此我一直使用它。
再次指定它只是为了确保与skipna = 'True'
产生相同的结果,也numeric_only
不会改变任何东西。
那么我做错了什么?
您使用的是什么熊猫版本?这符合版本'0.17.0' – EdChum
中描述的我在'0.14.1'。可能已经宣誓我几周前才更新。但是,[0.14.1文档](http://pandas.pydata.org/pandas-docs/version/0.14.1/generated/pandas.DataFrame.mean.html?highlight=mean#pandas.DataFrame.mean )也是这样说的。如果我做了一个'df.head()'并且我得到了上面的输出,那应该是真的意味着这是我的数据框,对吗?所以不能有任何隐藏的零? –
但除了解释'为什么'的答案,我必须同意文档应该更新! – joris