我有两个相同结构(模式)的Hive表。将它们连接成具有相同结构的单个表的高效SQL请求是什么?蜂巢:快速连接两个表成一个?
更新,这个工作相当快在我的情况:
CREATE TABLE XY AS SELECT * FROM ( SELECT *
从X UNION ALL
SELECT *
Y的 )TMP;
我有两个相同结构(模式)的Hive表。将它们连接成具有相同结构的单个表的高效SQL请求是什么?蜂巢:快速连接两个表成一个?
更新,这个工作相当快在我的情况:
CREATE TABLE XY AS SELECT * FROM ( SELECT *
从X UNION ALL
SELECT *
Y的 )TMP;
如果您试图将table_A
和table_b
合并为一个,最简单的方法是使用UNION ALL
运算符。您可以在这里找到语法和使用案例 - https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Union
“union all”是一个正确的解决方案,但可能是昂贵的,资源/时间明智的。我建议创建一个带有两个分区的表,一个用于表A,另一个用于表B.这样,不需要合并(或合并所有)。只要两个分区都被填充,合并表即可用。
这不提供问题的答案。一旦你有足够的[声誉](https://stackoverflow.com/help/whats-reputation),你将可以[对任何帖子发表评论](https://stackoverflow.com/help/privileges/comment);相反,[提供不需要提问者澄清的答案](https://meta.stackexchange.com/questions/214173/why-do-i-need-50-reputation-to-comment-what-can- I-DO-代替)。 - [来自评论](/ review/low-quality-posts/18915443) –
你有没有尝试过没有成功? – vefthym
请参阅我的问题更新 – DarqMoth