我正在使用Cassandra来存储我解析的站点日志。我有两个具有多个二级索引的列族。日志数据本身大小约为30 GB。然而,cassandra数据库的大小是〜91g。有什么办法可以减少这家商店的大小?另外,将有多个二级索引对数据存储大小有重大影响?Cassandra数据存储大小
2
A
回答
4
潜在地,二级指标可能会产生很大的影响,但很明显,这取决于您对它们的投入!如果大多数数据条目都出现在一个或多个索引中,那么这些索引可能占您存储空间的很大一部分。
您可以看到每个列族使用JConsole和/或'nodetool cfstats'有多少空间。
您还可以查看磁盘数据文件的大小以了解使用情况。
也有可能数据没有经常刷新到磁盘 - 这可能导致很多commitlog文件长时间留在磁盘上,占用额外的空间。如果您的某些列系列仅轻载,则会发生这种情况。请参阅http://wiki.apache.org/cassandra/MemtableThresholds以获取调整参数。
如果您有很多小列,那么列名可能会占用相当大比例的存储空间,所以在有意义的情况下可能需要缩短它们的大小(如果它们是时间戳或其他有意义的数据,则不是这样)。 。
相关问题
- 1. Cassandra存储vs内存大小调整
- 2. Cassandra缓存大小和JVM堆大小
- 3. GAE转到数据存储大小
- 4. 本地存储数据库大小
- 5. infinispan文件存储大小与数据大小不成比例
- 6. Cassandra存储数据的哪个节点?
- 7. 分布式数据存储 - Hazelcast与Cassandra
- 8. 在cassandra中存储冗余数据
- 9. Mongodb和Cassandra数据存储机制
- 10. Cassandra在BLOB中存储数据
- 11. cassandra中的数据存储问题
- 12. Apache Cassandra磁盘上的数据存储
- 13. Cassandra数据库行大小是否受可用内存限制?
- 14. cassandra无法存储跨分区大小限制的关系吗?
- 15. 减少Google应用引擎的大小数据存储存储数据
- 16. 在cassandra中存储小文件
- 17. 如何在Cassandra中存储小文件?
- 18. Cassandra DB:可以在Cassandra数据库中存储XML文件吗?
- 19. ODBC存储大小
- 20. 数据大小没有限制时的有效数据存储
- 21. 不同的数据存储大小和数据配额
- 22. Cassandra和堆大小
- 23. Cassandra最小堆大小
- 24. Salesforce最小化数据存储大小的最佳实践
- 25. Azure Blob存储区中元数据的最大大小
- 26. 数据存储中实体的最大大小?
- 27. 什么是存储数据的最大大小
- 28. 使用密钥存储无限大小的巨大json数据
- 29. 存储大数据python
- 30. 存储大量数据点?
感谢您的DNA提示!我做了一些分析,发现快照也占用了很多空间。 –
好点 - 您可以使用nodetool本地和全局删除快照,或者只是手动删除它们。 – DNA