让说我有以下的数据帧:基于值(带重复)提取熊猫数据框的子集?
elements = [1,1,1,1,1,2,3,4,5]
df = pd.DataFrame({'elements': elements})
df.set_index(['elements'])
print df
elements
0 1
1 1
2 1
3 1
4 1
5 2
6 3
我有一个列表[1, 1, 2, 3]
,我想数据帧包括4个元素的子集,例如:
elements
0 1
1 1
5 2
6 3
我已经能够通过构建一个计数数组中的项目发生的字典并通过附加最初的子部分来构建新的数据框来处理它。
您是否知道一些数据框方法来帮助我找到更优雅的解决方案?
@jezrael之后评论:我必须补充说我需要跟踪初始索引(以df为单位)。
我们可以看到DF(第一数据帧)作为资源库,我需要跟踪哪些行/指数都归功于:
的使用情况是:在DF元素中给我两个1,一个2一个3.我会持续存在的事实,我有行0和1为1,如2行4和行5为3.
好的答案:我可能没有排序的系列。但是我们可以对L和df.elements进行排序。我将它添加到你的答案中 – tokiloutok