我需要存储具有多个分段(聚合)可能性的原始(未聚合)数据。例如:一天,一天中的小时,设备等。至少有6个分割列,每列有平均5个唯一值。我需要在各种范围内管理这些数据的所有可能的聚合。具有多个聚合列的100M /月行的方法
在例如:
- 我需要一天的日子和时辰分组columnX的总和较上月
- 我需要columnX的总和,columnY的平均分为按月份和设备从去年
它必须是原始数据。这项规定每月将产生平均1亿条记录。我无法存储任何款项,因为我必须为每个分段列组合存储每个可能的总和。
什么数据库引擎/设计是最优化这样的任务呢?最初我们选择MySQL数据库的应用程序,但在选择时,我们并没有完全意识到需要提取的数据结构和统计数据。现在,当我知道它时,我想到了表格分区,但我不熟悉它,并且不确定它是否真的有帮助,因为范围很广。如果它没有帮助,如果MySQL失败了这个任务,无论是表设计,还是做什么?像MongoDB这样的非关系引擎的例子?
查询要求 - 不超过2-3秒。
认为公司硬件资源,数据库处理 - 对夫妇的高品质服务器,但肯定不是数十或数百个。