首先,我对大数据和Hadoop世界比较陌生,并且我刚刚开始尝试使用Hortonworks Sandbox(到目前为止,Pig和Hive)。 我想知道在哪些情况下可以使用上述Hadoop,Hive,Pig,HBase和Cassandra工具?
Hadoop,Hive,Pig,HBase,Cassandra - 什么时候用?
在我的沙箱环境中,只有9MB的文件Hive和Pig的响应时间为几分钟到几分钟。这在某些情况下显然不可用,例如Web应用程序(除非它是其他内容,例如我的虚拟机设置)。
我有关正确用法的猜测是:
- 的Hadoop:就剩下了技术基础,它会直接使用只有极少数的使用情况
- 蜂巢或猪:在分析过程即每小时或每天一次运行
- HBase的或卡桑德拉:用于需要
附加100毫秒或更少的响应时间的实时应用(例如web应用)何时使用HBase而不是何时使用Cassandra?
谢谢!
我认为Hadoop的意思是HDFS,因为Hive,Pig和HBase主要使用HDFS作为他们的文件系统。 –