我想从不适合创建协方差矩阵的数据框创建协方差矩阵。如何安排RPostgreSQL查询并在R中创建协方差矩阵
使用RPostgreSQL查询我有以下类型的数据帧的数据库后:
pg_id item_id value date
1 67808755896 23.5 2016-11-12
2 223337345 0 2016-11-12
3 254337000000 1 2016-11-12
4 34604777037 0 2016-11-12
5 142223438000 14.3 2016-11-12
6 170555690000 22 2016-11-12
整个数据帧是000行〜500与大致16 000 ITEM_ID的。 item_id被重复(在这里回顾几个月)。
我最终想做的是为item_id的值创建一个协方差矩阵。
为了如此,作为第一步,我要重新安排,我结束了一个数据帧的方式将数据帧,将如下所示:
item_id
date 67808755896 223337345 254337000000 ...
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
2016-11-12 value value value
我的问题是,我不知道如何以我需要的方式重新排序数据帧。
如果有一个SQL查询可以在检索时给我选项来获得所需的结构,那么我想这样做会是最好的。
在R内,我尝试了使用融合以及传播的一些事情,但计算似乎对我的本地mac很重,最后一次我试图在某个时候关闭它。
在此先感谢您的帮助!
谢谢配合!已经尝试过其中一个,但没有想过fun.aggregate = mean。好的,拯救我的一天! – Elia
“平均值”仅仅是一个例子,它通过建立平均值来总结一个网格单元中的多个数据点。你当然也可以使用'length'(数据点数),'sum'或其他函数...... – lukeA