我有我通过阅读使用numpy的制表符分隔文本文件中创建一个矩阵,它看起来是这样的:过滤,分组,并计算统计numpy的矩阵数据
sample category_a category_b value
------ ---------- ---------- -----
1 A Z 3.92
2 A Y 12.43
3 B Z 5.87
4 B Y 6.71
etc...
我想过滤或对数据进行分组以执行一些基本统计数据,例如计算单个类别的每个值的平均值或类别的组合。不幸的是,我是Numpy的新手,在文档中看不到任何明显的这种类型的功能。是否可以按类别对矩阵数据进行分组并进行计算?或者当我从文件中读取数据并进行计算时,是否需要过滤进入矩阵的数据?
可以过滤像数据这个:http://stackoverflow.com/questions/3030480/numpy-array-how-to-select-indices-satisfying-multiple-conditions 也有一些参考这里的内置功能,也许其中一个功能你需要什么:http://docs.scipy.org/doc/numpy/reference/routines.sort.html –
我建议你看看['pandas'](http://pandas.pydata.org/ )。 – BrenBarn
@BrenBarn:看起来它可能比基础Numpy更适合我需要做的事情。谢谢! – woemler