从具有管分隔符的巨大文件创建包含大量列(字符串)(> 100)的Hive表的最佳方式是什么?Hive创建包含大量列的表
- 如果我在create table命令中提到超过100个列名,会出现问题吗?
如果我决定不想命名每个列,我可以a)根本不提及列名称,并让Hive按照其默认命名命名列名称。我该怎么做b)提及只有一些列表示第一个10.在这种情况下剩余列会发生什么? 我试着这样说:
CREATE EXTERNAL TABLE IF NOT EXISTS table1 ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LOCATION 'folder1/folder2/folder3/filename';
我得到一个错误说“列列出或应指定自定义序列”。我需要一个自定义序列化程序吗? 如果外部表没有分区,我该如何添加分区?
你可以在apache drill或impala中做到这一点 – nir
如果你创建一个只有一个字符串列的导入表,并以这种方式引用文件,它可能会工作。然后,您可以使用'create table as'语句来执行一个查询,该查询使用可能的split来从字符串中生成数组,然后使用explode语句将其转换为表格。虽然从这里拍摄臀部...... – LiMuBei