2014-11-01 96 views
1

我的最终目标是将来自API调用的JSON数据解析为CSV文件。我正在使用Yelp API http://www.yelp.com/developers/documentation/v2/examples的示例代码。我得到的最好的结果是将数据写入一个CSV文件,但它不是很漂亮。我相信我错过了首先将数据放入Python字典中,但我研究并尝试了一些方法,导致我无处可去。将JSON数据导入CSV格式

try: 
    CSVfile = open('C:\Users\Petr Fedorov\Desktop\YelpAPI.csv', "wb") 
    response = json.dump(conn.read(),CSVfile,sort_keys=True) 
    #response = json.loads(conn.read()) #this is the original code under try: 

finally: 
    conn.close() 
    CSVfile.close() 

return response 

我已阅读了以下文章,但无法采用他们的方法。

Parsing values from a JSON file using Python? How do I write JSON data to a file in Python? Creating a JSON response using Django and Python

你的时间和提供的代码或指导我在正确的方向努力是极大的赞赏。

下面是原码输出采样...响应= json.loads(conn.read())

Result for business "affordable-interior-design-new-york" found: 
{ u'categories': [[u'Interior Design', u'interiordesign']], 
    u'display_phone': u'+1-917-686-1319', 
    u'id': u'affordable-interior-design-new-york', 
    u'image_url': u'http://s3-media1.fl.yelpcdn.com/bphoto/taBV7OM7mNyS_pQD7ifSVw/ms.jpg', 
    u'is_claimed': True, 
    u'is_closed': False, 
    u'location': { u'address': [], 
       u'city': u'New York', 
       u'coordinate': { u'latitude': 40.7376543584561, 
            u'longitude': -74.0053272269531}, 
       u'country_code': u'US', 
       u'display_address': [u'West Village', u'New York, NY 10014'], 
       u'geo_accuracy': 9.5, 
       u'neighborhoods': [u'West Village'], 
       u'postal_code': u'10014', 
       u'state_code': u'NY'}, 
    u'mobile_url': u'http://m.yelp.com/biz/affordable-interior-design-new-york', 
    u'name': u'Affordable Interior Design', 
    u'phone': u'9176861319', 
    u'rating': 5.0, 
    u'rating_img_url': u'http://s3-media1.fl.yelpcdn.com/assets/2/www/img/f1def11e4e79/ico/stars/v1/stars_5.png', 
    u'rating_img_url_large': u'http://s3-media3.fl.yelpcdn.com/assets/2/www/img/22affc4e6c38/ico/stars/v1/stars_large_5.png', 
    u'rating_img_url_small': u'http://s3-media1.fl.yelpcdn.com/assets/2/www/img/c7623205d5cd/ico/stars/v1/stars_small_5.png', 
    u'review_count': 10, 
    u'reviews': [ { u'excerpt': u'Classes are structured in a very practical manner. It sets up a basic layout and gives you a foundation about what to take care of step-by-step.\nAnd yes,...', 
        u'id': u'Vu5-xvjUII0wCV3Q-1vz8w', 
        u'rating': 4, 
        u'rating_image_large_url': u'http://s3-media2.fl.yelpcdn.com/assets/2/www/img/ccf2b76faa2c/ico/stars/v1/stars_large_4.png', 
        u'rating_image_small_url': u'http://s3-media4.fl.yelpcdn.com/assets/2/www/img/f62a5be2f902/ico/stars/v1/stars_small_4.png', 
        u'rating_image_url': u'http://s3-media4.fl.yelpcdn.com/assets/2/www/img/c2f3dd9799a5/ico/stars/v1/stars_4.png', 
        u'time_created': 1324256900, 
        u'user': { u'id': u'r9ecgI5mnHgPo4W0fPRqPA', 
          u'image_url': u'http://s3-media4.fl.yelpcdn.com/photo/kcsQCRHtTmZcwPtE7_aeAQ/ms.jpg', 
          u'name': u'Wendy G.'}}], 
    u'snippet_image_url': u'http://s3-media4.fl.yelpcdn.com/assets/2/www/img/cc4afe21892e/default_avatars/user_medium_square.png', 
    u'snippet_text': u'So much more than I could have hoped for. Betsy is fun, funny, and REALLY good at Interior Design.\n\nThe 3 hour plan was perfect.', 
    u'url': u'http://www.yelp.com/biz/affordable-interior-design-new-york'} 
+1

如果您有选择,我的第一个建议是*不*要序列化为CSV。 JSON是一个完美的cromulent序列化格式。除此之外,您需要发布样本输入和期望的输出;由于JSON支持任意嵌套结构而CSV不支持JSON-> CSV的通用映射。 – roippi 2014-11-01 21:58:24

+0

@roippi我想输出为CSV,因为那将是数据的最终目的地。我添加了原始代码的输出。任何指导表示赞赏。就像我提到的,我是Python的一个完整的新手。我在VBA中编写了一些东西,但这就是它的原因,所以这就是为什么我完全迷失在像JSON,字典,转换等东西。再次感谢任何指导。 – 2014-11-01 22:43:11

+0

json是一个嵌套的数据结构,并且csv文件通常是平坦的 - (除非你想重复列) - 你确定你需要csv吗? – 2014-11-02 19:57:58

回答

1

其实,你的反应已经是一个Python字典。你可以做的一件事是将数据放入一个pandas DataFrame对象中。然后从那里输出到csv。

你可以直接从JSON字符串

import pandas as pd 
df = pd.read_json(conn.read()) 

或者你也可以做到这一点从Python字典。

df = pd.from_dict(response) 

然后你就可以将其输出到csv

df.to_csv('file.csv') 

的一个问题是,你必须响应已超过1平。换句话说,有嵌套字典。你需要有一些这种格式

r = {'a': [list], 'b': [list] , 'c': value, 'd':value} 

换句话说,该值不能字典。这意味着您仍然需要操作字典数据,以便首先像选择数据的某些部分那样将其转换为正确的格式。