2017-01-30 22 views
1

我试图修改整列值,但我一直有列表超出范围的问题。这是我的全部代码:应用函数导致列表索引超出范围

# Libraries 
import json, requests 
import pandas as pd 
from pandas.io.json import json_normalize 

# Set URL 
url = 'https://api-v2.themuse.com/jobs' 

# For loop to extract data 
for i in range(100): 
    data = json.loads(requests.get(
     url=url, 
     params={'page': i} 
    ).text)['results'] 

# JSON to PANDAS 
data_norm = pd.read_json(json.dumps(data)) 

# Modify two columns' values 
data_norm.locations = data_norm.locations.apply(lambda x: [{x[0]['name']}]) 
data_norm.publication_date = pd.to_datetime(data_norm.publication_date) 

这里的问题是,当我使用的功能

data_norm.locations = data_norm.locations.apply(lambda x: [{x[0]['name']}]) 

我收到以下错误:

IndexError: list index out of range 

理想情况下,我想改变location从此列:

0    [{'name': 'Seattle, WA'}] 
1 [{'name': 'San Francisco Bay Area'}] 
2    [{'name': 'Palo Alto, CA'}] 
3     [{'name': 'Reno, NV'}] 
4          [] 
Name: locations, dtype: object 

成这样:

0      Seattle, WA 
1   San Francisco Bay Area 
2     Palo Alto, CA 
3      Reno, NV 
4          
Name: locations, dtype: object 
+1

显示data_norm.head(),以获得更好的帮助。然而,这听起来data_norm索引是不是整数,或者至少没有0在它至少 – Boud

+0

@Boud刚刚更新了原来的帖子 –

回答

2
data_norm.locations = data_norm.locations.apply(lambda x: 
               [{x[0].get('name', '')}] 
               if len(x) > 0 else [] 
               ) 

注意,这假定,如果该条目包含至少一个元件,所述第一元件是一个字典。你的代码的问题是你试图访问一个空的数组的第一个(索引0)元素。

编辑

要删除[{}],按您的评论:

data_norm.locations = data_norm.locations.apply(lambda x: 
               x[0].get('name', '') 
               if len(x) > 0 else '' 
               ) 
+0

谢谢,它的工作! –

+0

如何在每个值周围移除“[{}]”?例如,我想删除'[{}]'只得到'西雅图,华盛顿州' –

+1

刚刚为您更新了答案 – scomes