2013-07-04 38 views
4

我想乘两个Series,都与MultiIndex乘两个系列具有多指标在熊猫

import pandas as pd 
tuples = [(0, 100, 1000),(0, 100, 1001),(0, 100, 1002), (1, 101, 1001)] 
index_3levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2","l3"]) 
tuples = [(0, 100), (1, 101)] 
index_2levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2"]) 
data_3levels = pd.Series(1, index=index_3levels) 
data_2levels = pd.Series([2,3], index=index_2levels) 
print data_3levels 
l1 l2 l3 
0 100 1000 1 
     1001 1 
     1002 1 
1 101 1001 1 
dtype: int64 
print data_2levels 
l1 l2 
0 100 2 
1 101 3 
dtype: int64 

的问题是,我不能从2到3的水平重新索引Series

data_2levels.reindex(data_3levels.index, level=["l1","l2"]) 
Exception: Join on level between two MultiIndex objects is ambiguous 

我发现此解决方法:

for l1 in [0,1]: 
    data_3levels[l1] *= data_2levels[l1].reindex(data_3levels[l1].index, level="l2") 
print data_3levels 
l1 l2 l3 
0 100 1000 2 
     1001 2 
     1002 2 
1 101 1001 3 
dtype: int64 

但我认为有肩膀d只需要1步即可完成此操作。

回答

1

试试这个。 reset_index移除最后一个级别,所以它们是相同的,当你乘

In [25]: x = data_3levels.reset_index(level=2,drop=True)*data_2levels 

既然你想要的原始索引(和形状没有改变),这个工程。

In [26]: x.index=data_3levels.index 

In [27]: x 
Out[27]: 
l1 l2 l3 
0 100 1000 2 
     1001 2 
     1002 2 
1 101 1001 3 
dtype: int64 
+0

谢谢,我测试了我的实际数据集(几百万次采样),复位指数是快,但乘法是很慢的,我猜是因为匹配指数是慢。有没有更高效的选择? –

+0

肯定只是乘数组本身并设置索引之后;但您必须确保数据大小相同。你在这里的目标是什么? – Jeff

+0

数组大小不一样,就像本例中一样。第一个数组有3个级别,第二个数组只有前2个,我想将它们乘以匹配的索引。 –

1

有一个解决方法,直到通过各种增强请求“好”的解决方案。

你可以简单:

  • unstack有问题的指数水平(S)的距离
  • 做乘法
  • stack有问题的指数水平(S)回来了。

像这样:

In [92]: data_3levels.unstack('l3').mul(data_2levels, axis=0).stack() 
Out[92]: 
l1 l2 l3 
0 100 1000 2 
     1001 2 
     1002 2 
1 101 1001 3 
dtype: float64