2013-06-29 79 views
2

我需要一些帮助,在数据框中形成一个新变量 我有一个非常大的数据集,我想从另一列中的现有数据创建一个新变量。 这里是一个例子。从熊猫数据框中的现有数据中创建一个新变量

>>> df 
    A B 
0 a 1 
1 b 2 
2 c 3 
3 a 5 
4 d 6 

我wwant创建与A中的值a和c的新列,并将其命名交流,以及b和d并将其命名为BD 最终的结果应该的样子。将它们从A分组,并在新列中为该组添加新名称。

>>> df 
    A B C 
0 a 1 ac 
1 b 2 bd 
2 c 3 ac 
3 a 5 ac 
4 d 6 bd 

/纳斯

+0

如何用C的映射来确定 – Jeff

+0

a或c应该导致在C列的交流...这是一个和C应该被设置为beloning到一个称为交流.. – jonas

回答

1
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd') 

In [5]: df['C'] = [ mapper[x] for x in df['A'] ] 

In [6]: df 
Out[6]: 
    A B C 
0 a 1 ac 
1 b 2 bd 
2 c 3 ac 
3 a 5 ac 
4 d 6 bd 
+0

谢谢杰夫!那就是我在找的! – jonas

相关问题