我试图使用ff
包将大型(370万行,180列)数据集读入R中。数据集中有几种数据类型 - 因子,逻辑和数字。使用read.csv.ffdf()会抛出一个错误
问题是在读数值变量时。例如,我的专栏之一是:
TotalBeforeTax
126.9
88.0
124.5
90.9
...
当我尝试在读取数据时,被抛出了以下错误:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got '"126.90000"'
我想声明的类integer
(它已经被声明为numeric
)使用colClasses
的说法,但无济于事。我也试着将其更改为a real
(不管是应该的意思),并开始读取数据,但在某些时候抛出:
Error in methods::as(data[[i]], colClasses[i]) :
no method or default for coercing “character” to “a real”
(我的猜测是,因为它遇到一个NA
并没有按我不知道该怎么处理它。)
有趣的是,如果我将该列声明为factor
,则所有内容都会很好地读取。
什么给?
另请参见http://stackoverflow.com/questions/22357396/ff-in-r-no-applicable-method-for-recodelevels – jwijffels