我目前正在运行一个项目,我们需要每年为大约2亿个帐户存储400亿个文档(PDF,TIFF),并且想知道是否可以使用Cassandra进行此操作?这主要是因为Cassandra设计中的可扩展性,稳定性和多个数据中心的使用。Cassandra用于存储文档
但我想知道为此使用Cassandra是否是一个好主意 - 或者像CouchDB这样的另一种选择是更好的选择吗?
刚一说明,我们不需要在文件全文检索,并为每个文档只会有一个有限的连接到每个元数据 - 独特的ID,如日期,时间,来源,所有者和,再加上一些关键字。通常通过对所有者ID的查询来完成对文档的访问,并从那里选择通过原始和可选的日期/时间需要的文档。所以没有什么幻想。
感谢您对此的看法。