当我执行命令:Python的 - 与scikit错误学习随机森林约值格式
clf.fit(train_data, train_label)
我获得以下错误
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
的问题是阵列train_data
大小为( 18000,20)。我试图用这个命令:
clf.fit(np.float32(train_data), train_label)
或
train_data = np.array([s[0].astype('float32') for s in train_data])
查找下面的链接火车文件(Python)的数据集train_data和train_label:
https://www.dropbox.com/s/b3017gi18x6x325/train?dl=0
但是,我无法得到数组“train_data”中的所有值对clf.fit
函数有效。任何帮助?
这应该是因为你有一个错误的值在矩阵中的一个条目(NaN或无穷)......也就是说,你的矩阵是单数,或者你从一开始就在'train_data'上有错误。如果你使用其他的train_data,它不会提示它应该没问题。你的'train_data'看起来怎么样? – DarkCygnus
你能上传train_data和train_label吗?也许你在train_data中有任何字符串或NaN? – sera
请@sera找到添加链接中的数据集。谢谢 –