在我的lambda架构中,我在讨论是否使用HDFS或Cassandra来存储我的不可变数据。我需要Cassandra来处理在线请求等,因此它是技术栈的强制性部分。现在,如果我不需要,我不想将新工具(HDFS)引入到堆栈中。所以我的问题是,如果我不使用HDFS并使用Cassandra来托管我的不可变数据,我将会丢失什么。HDFS或Cassandra?
编辑:
我明白HDFS是一种分布式文件系统,Cassandra是的NoSQL数据库。尽管如此,两者都支持数据复制,都支持高吞吐量写入。另外Cassandra支持低潜在数据检索。所以我说得对,HDFS不会给我提供太多的帮助吗?
HDFS是一个分布式文件系统,而不是数据库。我认为要问的“正确”问题是“_HBase_ vs Cassandra?”,而不是“HDFS vs Cassandra?”。 –
@MattBall我意识到这一点。看到我的编辑 –
对不起,我没有看到编辑...? –