0
我想使用get命令从Hbase表读取数据,同时我也有行的关键字..我想在Spark流应用程序中执行此操作,是否有任何源代码可以分享?使用Spark中的Get命令从Hbase读取数据
我想使用get命令从Hbase表读取数据,同时我也有行的关键字..我想在Spark流应用程序中执行此操作,是否有任何源代码可以分享?使用Spark中的Get命令从Hbase读取数据
您可以使用Spark newAPIHadoopRDD
来读取Hbase表格,该表格返回RDD。
例如:
val sparkConf = new SparkConf().setAppName("Hbase").setMaster("local")
val sc = new SparkContext(sparkConf)
val conf = HBaseConfiguration.create()
val tableName = "table"
conf.set("hbase.master", "localhost:60000")
conf.set("hbase.zookeeper.quorum", "localhost:2181")
conf.set("zookeeper.znode.parent", "/hbase-unsecure")
conf.set(TableInputFormat.INPUT_TABLE, tableName)
val rdd = sc.newAPIHadoopRDD(conf, classOf[TableInputFormat], classOf[ImmutableBytesWritable], classOf[Result])
println("Number of Records found : " + rdd.count())
sc.stop()
或者你可以使用任何星火HBase的连接器像HortonWorks HBase的连接器。
https://github.com/hortonworks-spark/shc
您还可以使用火花凤凰API。
我不认为你可以使用Spark流这个。但是您可以使用Spark newHadoopAPI读取Hbase表格,该表格返回RDD或使用任何连接器,例如返回DataFrame或使用Phoenix Spark API的HortonWorks Hbase连接器。 – Shankar