我有一个大的矩阵(1,000,000行1,140列),我正在使用ff包存储。 有没有一种有效的方法来计算协方差矩阵?使用cov函数给出了以下错误: Error in cov(X) : supply both 'x' and 'y' or a matrix-like 'x' 考虑到cov不理解ff对象,这并不奇怪。我目前使用一个简单的嵌套for循环: covarianceMatrix <- matr
我在这里的“大数据处理”里面比较新,希望能找到一些关于如何处理50 GB csv文件的建议。目前的问题是以下几点: 表看起来像是: ID,Address,City,States,... (50 more fields of characteristics of a house)
1,1,1st street,Chicago,IL,...
# the first 1 is caused by w
我遇到内存问题,R给出Can not allocate vector of size XX Gb错误消息。我有一堆日常文件(12784天),以netcdf格式给出1305x378(经纬度)网格的海面温度。这样每天就可以得到493290分,在移除新地区(陆地点)时减少到约245000。 我的最终目标是从日常文件中为任何245000点建立一个时间序列,并找出每个点的时间趋势。我的想法是建立一个每行一个