2
我想下面的例子中,在那里我需要组列:大熊猫GROUPBY在列
import pandas as pd
import numpy as np
y = pd.DataFrame(np.random.randint(0,10, (20,30)).astype(float),
columns = pd.MultiIndex.from_tuples(
list(zip(np.arange(30),
np.random.randint(0,10, (30,))))
))
y.T.groupby(level = 1).agg(lambda x: np.std(x)/np.mean(x))
和它的作品。但是,以下返回一个错误:
y.groupby(level = 1, axis = 1).agg(lambda x: np.std(x)/np.mean(x))
我错过了什么吗?
UPD:继时,分别采取工程:
y.groupby(level = 1, axis = 1).agg(np.std)/\
y.groupby(level = 1, axis = 1).agg(np.mean)
这似乎是一个错误。 (我能够重现一个不同的数据集,这个数据集在列上有多个索引,每当你使用调用numpy函数的lambda函数,它会给出相同的错误。)也许尝试提交一个错误报告? https://github.com/pydata/pandas/issues – ayhan
我会去做的。只是觉得我太频繁地窃听它们;) –