2015-10-13 83 views
6

假设我有一个这样的数据帧:更改值值

Knownvalue A B C D E F G H 
    17.3413  0 0 0 0 0 0 0 0 
    33.4534  0 0 0 0 0 0 0 0 

我想做的事,就是当Knownvalue为0-10之间,A从0变当Knownvalue在10-20之间时,B从0变为1,等等。

它应该是这样的改变之后:

Knownvalue  A B C D E F G H 
    17.3413  0 1 0 0 0 0 0 0 
    33.4534  0 0 0 1 0 0 0 0 

任何人都知道如何运用改变它的方法?

+0

(注意:文字比图片更方便,因为您可以复制和粘贴文本,因此我已经回复到文本版本。) – DSM

回答

5

我首先将Knownvalue系列转换为等于其截断值除以十的整数列表(例如27.87 // 10 = 2)。这些桶表示所需列位置的整数。由于Knownvalue位于第一列,因此我将这些值加1。

接下来,我列举了这些bin值,它们有效地给出了行和列整数索引的元组对。我用iat到这些位置相等的值设置为1

import pandas as pd 
import numpy as np 

# Create some sample data. 
df_vals = pd.DataFrame({'Knownvalue': np.random.random(5) * 50}) 
df = pd.concat([df_vals, pd.DataFrame(np.zeros((5, 5)), columns=list('ABCDE'))], axis=1) 

# Create desired column locations based on the `Knownvalue`. 
bins = (df.Knownvalue // 10).astype('int').tolist() 
>>> bins 
[4, 3, 0, 1, 0] 

# Set these locations equal to 1. 
for idx, col in enumerate(bins): 
    df.iat[idx, col + 1] = 1 # The first column is the `Knownvalue`, hence col + 1 

>>> df 
    Knownvalue A B C D E 
0 47.353937 0 0 0 0 1 
1 37.460338 0 0 0 1 0 
2 3.797964 1 0 0 0 0 
3 18.323131 0 1 0 0 0 
4 7.927030 1 0 0 0 0 
+0

忘记包括'numpy'导入,看起来不错tho – Leb

+0

什么适用(地板)在这里做?我真的不知道...... –

+0

你能解释一下:“对于n,c在枚举(idx)中: df.iat [n,c + 1] = 1”? –

4

一种不同的方法将是使用get_dummies重建从Knownvalue列中的帧:

>>> import string 
>>> new_cols = pd.get_dummies(df["Knownvalue"]//10).loc[:,range(8)].fillna(0) 
>>> new_cols.columns = list(string.ascii_uppercase)[:len(new_cols.columns)] 
>>> pd.concat([df[["Knownvalue"]], new_cols], axis=1) 
    Knownvalue A B C D E F G H 
0  17.3413 0 1 0 0 0 0 0 0 
1  33.4534 0 0 0 1 0 0 0 0 

get_dummies的辛勤工作:

>>> (df.Knownvalue//10) 
0 1 
1 3 
Name: Knownvalue, dtype: float64 
>>> pd.get_dummies((df.Knownvalue//10)) 
    1 3 
0 1 0 
1 0 1