0
我使用Avro的文件数据存储在HDFS复制。我需要从一个avro文件复制选定的列数据并将其发送到同一个集群中具有其自己的模式文件(具有选定列信息)的另一个位置。我怎样才能做到这一点?是否可以使用Hive实现?或者HDFS中是否有任何实用工具可以帮助我做到这一点?HDFS集群内与选定列
这是必需的,因为一组必须能够访问整个表,而另一组应该能够访问只有几列。所以,我需要它们只在HDFS中的一个单独位置,只有所需的模式和avro文件。
请分享您的单词详细信息 – Raghavendra
_“intercluster”_表示您正在两个不同的群集之间移动数据。这里不是这种情况。请删除该单词或替换为“intracluster”(但没有用)。 –