在熊猫数据框中总结所有值的最佳方式是什么？

>>> import pandas as pd 
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]}) 
>>> print df.sum().sum() 
42 
>>> print df.values.sum() 
42

只是想确保我不会错过更明显的东西。

2016-08-03 Bill

df.values

是底层numpy的阵列

df.values.sum()

是对numpy的总和方法和更快

2016-08-03 02:49:04 piRSquared

感谢。我也这么想！ – Bill

纯粹是因为一个函数调用另一个函数还是存在一些更基本的区别？ – kuanb

@ kuanb有两个原因。其中一个'df.values.sum（）'是一个'numpy'操作，大部分时间'numpy'的性能更高。两个'numpy'总和数组中的所有元素，而不管维数。 'pandas'需要两个独立的调用来为每个维度加上一个'sum'。 – piRSquared

回答