2016-01-20 22 views
0

是否有可能做到实时交互查询在Hadoop中?实时交互查询Hadoop中

当我使用蜂巢过渡纱/ TEZ延迟仍然过高,即使它是在实木复合地板/ OCR。

有什么建议吗?

在此先感谢

回答

1

Hadoop是不是实时或近实时查询一个不错的选择。在Hadoop中运行任何东西的延迟开销会很高。请考虑使用Apache火花(因为我希望你有一个批处理系统,因为你是使用Hadoop)。 Spark使用火花外壳提供交互式查询。您还可以使用Impala对存储在HDFS中的数据执行查询。与Hive相比,我相信Impala提供更快的查询。当然,或使用火花蜂巢,但真正的问题

+0

是火花蜂巢仍处于研究与开发分支,同为黑斑羚它可以有超过50个用户并发性......因此对于生产模式下,它不是真正的最佳选择 –

+0

考虑直接使用Apache spark吗?或Spark Shell进行交互式查询,具体取决于您的目标。 –

+0

没错这就是一个解决方案,但大多数企业仍想用自己的传统系统,如蜂房,或其他软件,如画面 –