我想这是一个dplyr比plyr更多的问题。为了提高速度,我在我写的一些代码中使用了data.table。期间的中间步骤我有一些基因组学与数据的表〜32,000行: > bedbin.dt
Source: local data table [32,138 x 4]
Groups: chr
bin start site chr
1 2 3500000 ssCTCF 1
2
(通过对象关系映射,我的意思是这里描述:Wikipedia: Object-relational mapping) 这里是我能想象在读该工作:一种“虚拟数据帧”是链接到数据库,并返回访问时SQL查询的结果。例如,head(virtual_list)实际上会在映射的数据库上返回(select * from mapped_table limit 5)的结果。 我发现这post by John Myle