还有一个类似的问题Large data - storage and query 但我认为我的问题更加困难。大数据:存储和查询
我有一个巨大的数据集,简化问题,假设每条记录都有3场,
日期,地点,对象
意味着这一天,对象访问哪个地方。
每天可以有5000万条新记录。我需要保留100天的数据。
和查询这样的:
- 给定一个日期范围,列出谁访问过特定位置X的所有对象;
- 给定日期范围,列出特定对象访问过的所有位置。
我该如何设计?有没有可能提供解决方案?任何工具,我应该尝试吗?我可以使用mongodb或hadoop吗?
而且,查询不需要很长时间,因为它将从前端查询。
谢谢。
如果使用关系数据库,我的问题是像sybase,db2这样的典型数据库,它们是否对表中的记录有限制?对于我的问题,我最终会有数十亿条记录。 – taox
是的,RDBMS应该能够处理这些记录 - 我已经更新了答案。不过,您可能需要获得DBA来帮助您调整数据库。 –
谢谢,我会试一试! – taox