2
我的源文件位于ftp服务器中,格式为csv。我想将这些文件导入到HDFS进行进一步处理。我不知道如何获得这些CSV文件。 任何人都可以帮助我吗?如何将csv文件从ftp服务器导入到hadoop(HDFS/HIVE/HBASE)?
我的源文件位于ftp服务器中,格式为csv。我想将这些文件导入到HDFS进行进一步处理。我不知道如何获得这些CSV文件。 任何人都可以帮助我吗?如何将csv文件从ftp服务器导入到hadoop(HDFS/HIVE/HBASE)?
您可以将这个过程分为两步,并将文件上传到hdfs。
第1步:从FTP服务器下载文件并存储在本地。这应该有所帮助:Transfer files from FTP server to local unix server
第2步:一旦你有本地文件,你可以使用hadoop fs -put将文件传输到hdfs。
例子。如果你的文件名是temp.csv你可以这样做:
hadoop fs -put temp.csv $hadoop_path
我认为这应该对你有帮助:[将文件从ftp复制到hdfs] [1]。 [1]:http://stackoverflow.com/questions/22627771/copy-files-from-ftp-to-hdfs –