2013-07-11 29 views

回答

1

选项1:集成集群。

优点:读取或写入HBase的MapReduce将作为数据局部性更高效。

缺点:HBase地区服务器会降低机器(Datanode和TaskTracker)的性能,因为它需要容纳一些CPU和内存。如果有很多MapReduce作业,HBase延迟可能是秒。因此,如果您希望及时制作HBase响应,则需要更多工作(例如,使用memcache来提高读取性能)。

选项2:2个群集。

Prons:HBase区域服务器不会影响HDFS日期节点和TaskTracker的性能。

缺点:如果MapReduce需要访问HBase,需要远程读写数据。该选件还需要更多的机器。