9
我想出了这两种方法。有更好的吗?在熊猫数据框中总结所有值的最佳方式是什么?
>>> import pandas as pd
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]})
>>> print df.sum().sum()
42
>>> print df.values.sum()
42
只是想确保我不会错过更明显的东西。
我想出了这两种方法。有更好的吗?在熊猫数据框中总结所有值的最佳方式是什么?
>>> import pandas as pd
>>> df = pd.DataFrame({'A': [5, 6, 7], 'B': [7, 8, 9]})
>>> print df.sum().sum()
42
>>> print df.values.sum()
42
只是想确保我不会错过更明显的东西。
df.values
是底层numpy的阵列
df.values.sum()
是对numpy的总和方法和更快
感谢。我也这么想! – Bill
纯粹是因为一个函数调用另一个函数还是存在一些更基本的区别? – kuanb
@ kuanb有两个原因。其中一个'df.values.sum()'是一个'numpy'操作,大部分时间'numpy'的性能更高。两个'numpy'总和数组中的所有元素,而不管维数。 'pandas'需要两个独立的调用来为每个维度加上一个'sum'。 – piRSquared