2014-04-30 51 views
2

我的源文件位于ftp服务器中,格式为csv。我想将这些文件导入到HDFS进行进一步处理。我不知道如何获得这些CSV文件。 任何人都可以帮助我吗?如何将csv文件从ftp服务器导入到hadoop(HDFS/HIVE/HBASE)?

+1

我认为这应该对你有帮助:[将文件从ftp复制到hdfs] [1]。 [1]:http://stackoverflow.com/questions/22627771/copy-files-from-ftp-to-hdfs –

回答

1

您可以将这个过程分为两步,并将文件上传到hdfs。

第1步:从FTP服务器下载文件并存储在本地。这应该有所帮助:Transfer files from FTP server to local unix server

第2步:一旦你有本地文件,你可以使用hadoop fs -put将文件传输到hdfs。

例子。如果你的文件名是temp.csv你可以这样做:

hadoop fs -put temp.csv $hadoop_path 
相关问题