我有一个巨大的逗号分隔的文件(每秒1.5 Gb),并希望在R.读取特定行从一个巨大的文件*快速*
我见过从文件中读取一个特定行(许多)这个问题的版本很多次,都表明类似
con = file(fileName)
open(con)
scan(con, what=list("character", "character"), skip=1000000, nlines=1, sep="\t", quiet=TRUE)
这样的作品,但它仍然是极其缓慢 - 我们20到30秒之间交谈读一行!
有没有更快的方法?当然,必须有一种快速的方式来跳转到特定的线...
非常感谢!
你可以使用'data.table'! – Metrics
http://stackoverflow.com/questions/18235269/efficiently-reading-specific-lines-from-large-files-into-r – Peyton