我即将开始一个新的项目,它基本上是一个报告工具,它应该有一个非常大的数据库。如何处理非常大的数据?
表的数量不会很大(< 200),大多数数据(80%)将包含在20个表中,所有数据几乎是插入/只读(无更新)。
该表中的估计数据量将以每分钟240,000条记录增长,并且我们应该保留至少1到3年的时间才能够执行各种报告,报告将由管理员在线查看。
我对这个大型数据库没有第一手经验,所以我要求那些有哪个DB在这种情况下是最好的选择。我知道Oracle是安全的选择,但如果有人有像hadoopdb或Google的大桌面这样的数据库以外的经验,那么我更感兴趣。 请指导我。 在此先感谢
您是否真的需要保留所有数据?你能以某种方式加总它吗?也许将原始数据合并到桶中?每秒4000条记录有点疯狂。你的记录有多大? – 2012-04-02 06:18:35
对于任何直接使用计算器的人,我会为您节省一点努力:3年后的记录数为3784.32亿次>< – Corbin 2012-04-02 06:19:12
@greg hewgill感谢您的回复。因为我的项目是报告工具,所以如果用户想要查看报告超过一年,那么我必须保持这一数据超过一年,长达3年。我汇总数据,但在所有报告结束时,我在单行表格中显示的数据不是汇总形式。 – jenitshah 2012-04-02 06:27:42