我将我的配置单元表以HDFS格式存储为Parquet格式。我可以将此位置的镶木地板文件转换为序列文件格式并在其上构建配置表格吗? 是否有任何程序可以执行此转换?将Parquet文件格式转换为序列文件格式
回答
创建新的序列文件表,并使用插入选择重新加载数据:
insert into sequence_table
select * from parquet_table;
让我试试看。谢谢。 –
如果我的序列表按年,月,日分区,那么我如何从我的镶木地板表中插入由年,月,日划分的所有记录,因为它是我的序列表中的记录? –
创建分区表,'插入覆盖表sequence_table分区(年,月,日)从实木复合地板表中选择,分区键应该是最后一个,通过分区键添加分配来减少压缩机的压力。如果目标表具有完全相同的结构,则可以选择*。 – leftjoin
hive> create table src (i int) stored as parquet;
OK
Time taken: 0.427 seconds
hive> create table trg stored as sequencefile as select * from src;
对于@AndyReddy
create table src (i int)
partitioned by (year int,month tinyint,day tinyint)
stored as parquet
;
create table trg (i int)
partitioned by (year int,month tinyint,day tinyint)
stored as sequencefile
;
set hive.exec.dynamic.partition.mode=nonstrict
;
insert into trg partition(year,month,day)
select * from src
;
如果我的序列表按年份,月份,日期分区,那么如何插入我的镶木地板表中按年,月,日分区的所有记录,因为它是我的序列表中的数据?只要插入? –
安迪,看到更新的答案。 –
- 1. 将文本文件转换为Spark Java中的序列格式
- 2. 将文本文件的格式转换为其他格式
- 3. 将.msg文件转换为.xps格式?
- 4. 将PowerPoint文件转换为ODP格式?
- 5. 将.log文件转换为CSV格式
- 6. 将文件路径从长格式转换为短格式
- 7. 将GenBank格式文件转换为FASTA格式
- 8. 如何将.npz格式转换为.py格式的.csv文件?
- 9. Google BigQuery支持Parquet文件格式吗?
- 10. 如何将两列的文本文件转换为fasta格式
- 11. 文件格式转换
- 12. 如何将.arff格式的文件转换为.txt文件格式?
- 13. 如何将表格从红移转换为Parquet格式?然后
- 14. 如何将.txt文件转换为Hadoop的序列文件格式
- 15. 文件:将两列转换为格式为php的数组
- 16. 如何将点云.pts文件转换为.pcd文件格式?
- 17. 将doc文件转换为docx文件格式
- 18. asp.net itextsharp将文件格式文件转换为PDF
- 19. 将Microsoft XML文件格式转换为Excel文件
- 20. 将eclipse格式化文件转换为checkstyle文件
- 21. 将3列文件转换为矩阵格式
- 22. 转换文件格式(PDF格式为TIFF?)
- 23. 配置单元中的序列文件格式和parquet文件格式是什么?
- 24. 将文本文件转换为VCF格式时出错
- 25. 如何将文本文件转换为.arff格式(weka)
- 26. Mahout:将一个大型文本文件转换为SequenceFile格式
- 27. 将文本文件转换为ANSI格式
- 28. 使用Python将文本文件转换为JSON格式
- 29. Python - 将文件格式化为列表
- 30. 转换.string文件格式转化成PHP数组格式
为什么........? ... –
@DuduMarkovitz我公司的其他一些团队希望将数据作为序列文件格式。 –