2017-06-29 25 views
-1

我有一些数据,看起来像这样转换CSV值列到单独列使用二进制的答案

ColumnName 
value 1, value 2 
value 1, value 3 

我想消除此列,而是与每个值的列替换,像这样。

value 1 value 2 value 3 
1  1  0 
1  0  1 

是否有库/函数调用可以帮我照顾这件事?我已经看到了R中有来自splitstackshape库基本相当于称为Csplit_e

回答

1

尝试:

import pandas as pd 


df = pd.DataFrame({'ColumnName': ['value 1, value 2', 'value 1, value 3']}) 


#   ColumnName 
# 0 value 1, value 2 
# 1 value 1, value 3 

pd.get_dummies(df.ColumnName.str.split(',', expand=True), prefix='', prefix_sep='') 


# value 1 value 2 value 3 
# 0  1   1   0 
# 1  1   0   1 

我希望这有助于。

+0

正是我所需要的,谢谢! –