我收集大量的数据中的哪一个最可能将是一个格式如下:大数据数据库
用户1:(A,O,X,Y,Z,T,H, ü)
其中所有的变量相对于时间动态改变,除了u - 这是用来存储用户名。自从我的背景在“大数据”中并不是非常激烈的时候,我想了解的是,当我结束数组时,它会非常大,例如108000 x 3500,因为我将在每个时间步执行分析,并绘制它,什么是一个适当的数据库来管理这是我正在试图确定。由于这是科学研究,我在看CDF和HDF5,并根据我在这里阅读的内容NASA我想我会想用CDF。但是,这是管理这些数据以提高速度和效率的正确方法吗?
最终的数据集将所有的用户作为列,并且这些行将被加时间戳,所以我的分析程序将逐行读取以解释数据。并输入数据集。也许我应该看看像CouchDB和RDBMS这样的东西,我只是不知道开始的好地方。建议将不胜感激。