4
我想乘两个Series
,都与MultiIndex
:乘两个系列具有多指标在熊猫
import pandas as pd
tuples = [(0, 100, 1000),(0, 100, 1001),(0, 100, 1002), (1, 101, 1001)]
index_3levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2","l3"])
tuples = [(0, 100), (1, 101)]
index_2levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2"])
data_3levels = pd.Series(1, index=index_3levels)
data_2levels = pd.Series([2,3], index=index_2levels)
print data_3levels
l1 l2 l3
0 100 1000 1
1001 1
1002 1
1 101 1001 1
dtype: int64
print data_2levels
l1 l2
0 100 2
1 101 3
dtype: int64
的问题是,我不能从2到3的水平重新索引Series
:
data_2levels.reindex(data_3levels.index, level=["l1","l2"])
Exception: Join on level between two MultiIndex objects is ambiguous
我发现此解决方法:
for l1 in [0,1]:
data_3levels[l1] *= data_2levels[l1].reindex(data_3levels[l1].index, level="l2")
print data_3levels
l1 l2 l3
0 100 1000 2
1001 2
1002 2
1 101 1001 3
dtype: int64
但我认为有肩膀d只需要1步即可完成此操作。
谢谢,我测试了我的实际数据集(几百万次采样),复位指数是快,但乘法是很慢的,我猜是因为匹配指数是慢。有没有更高效的选择? –
肯定只是乘数组本身并设置索引之后;但您必须确保数据大小相同。你在这里的目标是什么? – Jeff
数组大小不一样,就像本例中一样。第一个数组有3个级别,第二个数组只有前2个,我想将它们乘以匹配的索引。 –