2012-09-25 55 views
0

任何人都可以推荐我是否可以使用org.apache.hadoop.conf.Configuration和org.apache.hadoop.hbase.client.HTablePool从amazon hbase读取数据。从亚马逊hbase阅读数据

我们正在迁移到亚马逊的EMR框架,并在其上运行hbase。

目前的实现基于纯Apache Apache hadoop和hbase发行版。我试图验证即使我们迁移到亚马逊的EMR也不需要更改代码。

请分享您的想法。

回答

0

虽然不应该发生,但我会期待与EC2的性质及其网络相关的问题和变化。
HBase中继可以及时更新租约。如果区域服务器是两个忙碌的 - 因为对它们进行了大量的操作,他们不能这样做并从集群中启动。
在EC2实例的亚马逊性能是可预测的要少得多然后在专用群集(除非您使用群集实例),所以调整超时参数和/或您的负载的性质,可能需要获得集群正常工作

+0

喜大卫感谢您的评论。目前我使用apache hbase依赖检索数据。参数化“hbase.zookeeper.quorum”。检索数据和呈现报告。 我可以通过只更改“hbase.zookeeper.quorum”来从亚马逊的HBase使用相同的代码检索数据。 他们有独立的SDK吗? – dharshan

+0

我现在不完全是,但不会期望不同的版本。通常Amazon EMR与apache hadoop兼容(实际上是AFAIK) –