2014-12-01 193 views
1

当加载一个CSV文件看起来像这样与大熊猫

0 1 male 3 4 5 6 
1 0 female 6 7 8 9 
..... 

是可以自动转换第三栏为整数,例如0男1女分类变量?

+0

是的,这是,你怎么装呢? – 2014-12-01 20:24:36

回答

1

read_csv接受名为converters的参数。这可以作为一个文件读入到应用功能,以特定列converters应为以下形式的字典中传递:

{column_index: function_to_apply} 

您可以使用此功能适用于第三列。所有你需要做的是设置函数来获取从字典d它映射到"male"0"female"一个1值:

>>> d = {"male": 0, "female": 1} 
>>> pd.read_csv(file.csv, converters={2: d.get}) 
... 
0 1 0 3 4 5 6 
1 0 1 6 7 8 9 
...