2013-01-01 42 views
2

我在网上搜索的方式从非常大的json文件中提取数据
一些让我导入json文件的堆栈,并执行xpath/sql就像数据
上的脚本一样从中提取数据。
你能推荐我这样的开发堆栈吗?
我确实想避免在C++/java中加载json并对此进行编程。
MongoDB?有效的方式来操纵非常大的json文件?

回答

2

MongoDB非常适合这类任务。您可以使用使用mongo客户端mongoimport实用

mongoimport --db DB_NAME --collection COLLECTION_NAME --file YOUR_JSON_FILE 

然后,您可以探索数据的数据导入到MongoDB数据库。

$ mongo 
> use DB_NAME 
> db.COLLECTION_NAME.find() 

您可能需要索引某些领域更快地查找

> db.COLLECTION_NAME.ensureIndex({FIELD_NAME:1}) 

MongoDB的manual是入门真的很有帮助。

+0

直接链接到Java教程:http://www.mongodb.org/display/DOCS/Java+Tutorial – hyde

+0

我做到了错误: 异常:提供的JSON的BSON表示太大:解析JSON字符串时失败:“名称”:“T 断言:10340:失败解析附近的JSON字符串:”id“:”541 – user63898

+0

嗯,你能给你的json文件中的一些示例行? –