2015-05-29 130 views
2

我有以下的数据帧:如何大熊猫数据帧排序行的子集

import pandas as pd 
df = pd.DataFrame({'FavCol' : ['Fixy','Macky', 'querk', 'alber'], 
        'sample1' : [20.3, 25.3,3.1,3], 
        'sample2' : [130, 150,173,4],   
        'sample3' : [1.0, 2.0,12.0,4],   
        }) 

,看起来像这样:

In [12]: df 
Out[12]: 
    FavCol sample1 sample2 sample3 
0 Fixy  20.3  130  1 
1 Macky  25.3  150  2 
2 querk  3.1  173  12 
3 alber  3.0  4  4 

我想要做的就是进行排序(不区分大小写)基于FavCol的数据帧,但保持第一行Fixy完好无损。导致:

FavCol sample1 sample2 sample3 
    Fixy  20.3  130  1 
    alber  3.0  4  4 
    Macky  25.3  150  2 
    querk  3.1  173  12 

我该如何做到这一点?

更新

我有问题重现[用户:约翰·高尔特。 有了这些数据:

Group No. Abbr. of test substance Route Time (hrs) Dose (/body) Conc. Volume of dosage (/body) # of mouse 
1 PBS DMSO5% i.d. 6 0 mg 0 mg/ mL 0.1 mL 3 
2 MPLA i.d. 6 0.01 mg 0.1 mg/ mL 0.1 mL 3 
3 MALP2s i.d. 6 0.01 mg 0.1 mg/ mL 0.1 mL 3 
4 R848 i.d. 6 0.1 mg 1 mg/ mL 0.1 mL 3 
5 DMXAA i.d. 6 0.1 mg 1 mg/ mL 0.1 mL 3 

而这种代码:

import pandas as pd 
df = pd.read_table("http://dpaste.com/0JPC984.txt") 
colnames = df.columns.values.tolist() 
print colnames 
fixed_rown = colnames[1] 
df['lower'] = df[fixed_rown].str.lower() 
df.loc[1:] = df[1:].sort('lower') 
df 

它产生这样的:

Out[35]: 
    Group No. Abbr. of test substance Route Time (hrs) Dose (/body) \ 
0   1    PBS DMSO5% i.d.   6   0 mg 
1   2     MPLA i.d.   6  0.01 mg 
2   3     MALP2s i.d.   6  0.01 mg 
3   4     R848 i.d.   6  0.1 mg 
4   5     DMXAA i.d.   6  0.1 mg 

     Conc. Volume of dosage (/body) # of mouse  lower 
0 0 mg/ mL     0.1 mL   3 pbs dmso5% 
1 0.1 mg/ mL     0.1 mL   3  mpla 
2 0.1 mg/ mL     0.1 mL   3  malp2s 
3 1 mg/ mL     0.1 mL   3  r848 
4 1 mg/ mL     0.1 mL   3  dmxaa 

In [45]: pd.__version__ 
Out[45]: '0.16.1' 

dmxaa没有固定pbs dmso5%后问世。

回答

2

小写排序有点棘手。所以,你可以从FavCol

In [83]: df['lower'] = df['FavCol'].str.lower() 

使用.loc创建一个新的lower列添加排序顺序

In [84]: df.loc[1:] = df[1:].sort('lower').values 

In [85]: df 
Out[85]: 
    FavCol sample1 sample2 sample3 lower 
0 Fixy  20.3  130  1 fixy 
1 alber  3.0  4  4 alber 
2 Macky  25.3  150  2 macky 
3 querk  3.1  173  12 querk 

,如果你愿意,你可以删除lower列。

+0

我有问题再现你的代码。请参阅我的更新。 – neversaint

+0

'dmxaa'的确出现在固定的'pbs dmso5%'之后。你能再次检查吗?并且,提及你的'pd .__ version__'? – Zero

+0

我的版本是''0.16.1'。 – neversaint