2015-01-14 87 views
0

我正在尝试将R大于49,376行和73,625列的大空格分隔文件(14Gb)读取以供分析。将大文件读入R

我试过从data.table包使用fread,建议here

我收到错误

Error: segfault from C stack overflow 

是否有可能在这里使用另一种方法?任何其他软件包或某种解决此错误的方法?我的R会话信息如下。

R version 3.0.2 (2013-09-25) 
Platform: x86_64-unknown-linux-gnu (64-bit) 

locale: 
[1] LC_CTYPE=en_US  LC_NUMERIC=C   LC_TIME=en_US  
[4] LC_COLLATE=en_US  LC_MONETARY=en_US LC_MESSAGES=en_US 
[7] LC_PAPER=en_US  LC_NAME=C   LC_ADDRESS=C   
[10] LC_TELEPHONE=C  LC_MEASUREMENT=en_US LC_IDENTIFICATION=C 

attached base packages: 
[1] stats  graphics grDevices utils  datasets methods base  

other attached packages: 
[1] data.table_1.9.4 

loaded via a namespace (and not attached): 
[1] chron_2.3-45 tools_3.0.2 
+0

您是否使用[1.9.5,当前开发版本](https://github.com/Rdatatable/data.table/wiki/Installation)获取堆栈溢出?如果是这样,你能否在那里提出问题?谢谢。 – Arun

+0

也许你也可以更新你的R版本到最新版本。 –

+0

不幸的是,这是在服务器上运行的,我没有能力安装新的R版本。开发版本不解决问题。 – user3745089

回答

0

由于内存不足导致发生错误。一旦我增加了内存限制,fread按预期工作。