1
我有一个向量,我想应用皮尔逊相关性的熊猫数据框的所有行。我尝试以下操作:使用适用于熊猫数据框给出ValueError
df.apply(apply_func, axis=1, args=(np.array([1,2,3])), raw=True)
应用FUNC只是需要两个numpy
阵列和计算相关
def apply_func(v1, v2):
#do stuff
不过,我得到以下错误,当我尝试运行此
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
我在apply_func
设置了断点,我从来没有进入它。我确定我错误地使用了这个结构,但我不确定它是什么。我认为df
的每一行将作为第一位置参数传递给apply_func
,并且args
中的任何一行都将占用余下的部分。这是不正确的?
编辑我在下面创建了一个简单的例子,在这个例子中,apply_func
函数应该只添加两个向量。还是创造了同样的错误
data = {'k1': [1, 2, 3], 'k2': [4, 5, 6], 'k3': [7, 8, 9]}
df = pd.DataFrame(data)
def apply_func(v1, v2):
return v1 + v2
df.apply(apply_func, axis=1, args=(np.array([1,2,3])), raw=True)