2016-11-09 74 views
0
熊猫据帧

我期待找到大规模的在Python.I N维空间中心与K列一个数据框(一些包含文本和一些包含数字)中心质量在Python中

{X1 ...值Xk} ... {Z1..Zk}

K> 10000

我需要计算质量中心在数据帧的所有数值。

这样做的最佳方法是什么?

+0

是否每一行都是一个重点?大量的点是一样的吗?在这种情况下,只需删除字符串列并计算点的平均值。有可能是有这种功能的库。 –

回答

0

质量中心仅仅是在每个维度值的平均值,而你只是想计算它在非对象列,所以:

df.ix[:,df.dtypes != 'O'].mean() 

编辑:虽然OP只提到“text”和“numbers”,下面的替代方案确实比较一般(谢谢MaxU):

df.select_dtypes(include=['number']).mean() 
+0

我觉得有点robuster版本是'df.select_dtypes(包括= ['数字'])。mean()',因为也有'datetime','category'等等dtypes ... – MaxU

+0

谢谢,那工作 – DTML