2017-01-31 64 views
0

我在CestOS6.7上使用Mongo版本2.6.12。它是非群集的,即只安装在一台服务器上。如何从Linux/HDFS导入CSV文件到mongo数据库

我的项目需要将最终输出存储在MongoDB中。这些文件是存储在Linux和HDFS上的CSV文件。有人可以请指导我如何将CSV文件从Linux/HDFS导入mongo数据库。

由于Mongoimport默认输入为JSON文件,因此不起作用。我想这在蒙戈外壳,它没有

mongoimport news-output-20170125.csv --type csv 

2017-01-30T19:18:25.275-0600 SyntaxError: Unexpected identifier

+0

如果文件在Linux和HDFS,为什么HDFS重要吗?无论如何,'意外的标识符'似乎不言自明。阅读文档...'csv解析器接受符合RFC 4180的数据' –

+0

这可能会帮助您http://stackoverflow.com/questions/27112384/moving-hdfs-data-into-mongodb – BruceWayne

+0

谢谢。我的文件都在Linux和Hdfs上。我需要一种将文件从其中任何一个导入到mongodb的方法。上面的文件是在Linux上,当我做mongoimport时发生错误。 – TextShilpa

回答

0

Mongoimport从Linux现在正在为CSV文件。我从mongo-shell运行mongoimport。因此得到了错误。

[[email protected]**** ~]$ cat locations.csv 
Name,Address,City,State,ZIP 
Jane Doe,123 Main St,Whereverville,CA,90210 
John Doe,555 Broadway Ave,New York,NY,10010 
[[email protected]**** ~]$ pwd 
/home/mongoritter 
[[email protected]**** ~]$ mongoimport -d test -c test1 --type csv --file locations.csv –headerline 
connected to: 127.0.0.1 
2017-01-31T12:12:22.034-0600 imported 2 objects 

更多的帮助,您可以参考How to use mongoimport to import csv

现在,我会从HDFS进口检查的方式。我见过一个蒙戈文件,或者将检查,如果这个工程没有https://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part-1-introduction-setup

感谢, SHILPA