0
火花读取HBase的数据,如 //创建RDDspark从hbase读取数据,工作人员是否需要从远程驱动程序获取paritions数据?
val hBaseRDD = sc.newAPIHadoopRDD(conf, classOf[TableInputFormat],
classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],
classOf[org.apache.hadoop.hbase.client.Result])
例如,hBaseRDD有5个分区,现在执行的工人获取分区中的数据来计算,他们必须从远程驱动程序的数据? (不像从hdfs读取,每个工作者作为hadoop奴隶有hdfs文件复制)