我正在考虑开发一个带有Cassandra后端的应用程序。我希望,我将能够运行具有以下规格在商用硬件上的每个卡桑德拉节点:Cassandra存储vs内存大小调整
- 四核2GHz的酷睿i7 CPU
- 2个750GB磁盘驱动器
- 16 GB RAM安装
现在,我一直在网上阅读,Cassandra的可用磁盘空间应该是磁盘上存储的数量的两倍,这意味着每个节点(设置为RAID-1配置)能够存储375 GB的数据,这是可以接受的。
我的问题是,如果16GB内存足以有效地为每个节点提供375GB的数据。开发的应用程序中的数据也是相当时间依赖的,因此最近的数据将是从数据库中读取最多的数据。事实上,大部分数据将在大约6个月后被删除。
另外,我可以将Cassandra堆(-Xmx)分配到接近16 GB,还是Cassandra使用堆内存?
谢谢你的回答!你认为跳过RAID-1会更好一些,而将提交日志放在第二个磁盘(可以是7200旋转驱动器或256GB SSD),而是增加Cassandra复制因子? –