我有一个timeindex和包含三维向量的坐标3列一数据帧:熊猫申请函数返回多个值的行中大熊猫数据帧
x y z
ts
2014-05-15 10:38 0.120117 0.987305 0.116211
2014-05-15 10:39 0.117188 0.984375 0.122070
2014-05-15 10:40 0.119141 0.987305 0.119141
2014-05-15 10:41 0.116211 0.984375 0.120117
2014-05-15 10:42 0.119141 0.983398 0.118164
予想变换应用到每个行也返回一个矢量
def myfunc(a, b, c):
do something
return e, f, g
,但如果我这样做:
df.apply(myfunc, axis=1)
我结束ü p与元素为元组的Pandas系列。这是因为应用程序将取消myfunc的结果而不解压缩它。我如何更改myfunc以便获得具有3列的新df?
编辑:
下面工作的所有解决方案。 Series解决方案允许使用列名,List解决方案似乎执行得更快。
def myfunc1(args):
e=args[0] + 2*args[1]
f=args[1]*args[2] +1
g=args[2] + args[0] * args[1]
return pd.Series([e,f,g], index=['a', 'b', 'c'])
def myfunc2(args):
e=args[0] + 2*args[1]
f=args[1]*args[2] +1
g=args[2] + args[0] * args[1]
return [e,f,g]
%timeit df.apply(myfunc1 ,axis=1)
100 loops, best of 3: 4.51 ms per loop
%timeit df.apply(myfunc2 ,axis=1)
100 loops, best of 3: 2.75 ms per loop
这不起作用。它返回一个其元素是列表的系列。我在熊猫0.18.1 –