2016-11-21 58 views
-1

train.txt有3列。第一列和第二列保存在A中,但我不能将其用于fit_transform。为什么?请帮我为什么我的数组不适用于fit_traansform()?我能做什么?

from macpath import split 
from sklearn.feature_extraction import DictVectorizer 

A=[] 
B=[] 
C=[] 
D=[] 

vec = DictVectorizer() 

with open("train.txt") as f: 
    f1=[x.strip() for x in f if x.strip()] 
    for x in f1[0:]: 
     data=[tuple(x.split())] 
     for x in data: 
      A.append(x[0]+" "+x[1]) 
      B.append(x[2]) 

X=vec.fit_transform(A) 

enter image description here

+0

请附上您的代码,直接在你的问题,并使用相应的格式化选项来渲染它正确。 – Gormador

回答

0

你必须改变以下部分 A.append(x[0]+" "+x[1]) 本:

A.append({x[0],x[1]: 1 }) 
+0

它工作:)谢谢 –

相关问题