在Hue - > Hive查询浏览器中,我在Hive中创建了一个外部表,并使用以下语句将数据从我的一个CSV文件加载到它中:Hive:即使当表是外部时,源数据也被移动到hive数据仓库
CREATE EXTERNAL TABLE movies(movieId BIGINT, title VARCHAR(100), genres VARCHAR(100)) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE;
LOAD DATA INPATH '/user/admin/movie_data/movies' INTO TABLE movies;
我看到源文件“电影”从HDFS中消失并转移到配置单元数据仓库。我的印象是外部表格只能作为原始源数据的链接。
如果外部表不是独立于源数据 - 如果我要删除表,源文件仍然会保留?我如何创建这样的外部表格?
是否没有办法创建只是“指针”的外部表到源数据并独立于它(如在元数据表中)?这就是文档似乎谈论的内容。 –
当您使用外部关键字创建表格时,其外部表格指向hdfs位置。备份数据并删除表格,数据不会被删除...只要看看它就可以了。 –