2014-02-22 163 views
0

我有一个以下的JSON文件(请参阅下面的链接),我从网上读取。我想搜索一个特定的字符串并返回它的索引。大熊猫系列搜索元素

而且,如果有更好的方法来读取和操作比我如何在这里使用它其他的JSON数据,我想知道。谢谢!

JSON FILE

以下是我读文件:

import json 
import pandas as pd 
from pandas import DataFrame, Series 
#------------------------------------------------- 
# READING IN THE JSON FILE 
#------------------------------------------------- 
path = 'ads_nasa.txt' 
records = [json.loads(line) for line in open(path)] 
frame = DataFrame(records) 

我尝试使用以下,但它不工作:

frame.author[0].find('Deshpande, R.') 

如何搜索字符串和在熊猫核心系列中找到它的索引?

+0

此外,当我使用pd.read_json(路径)时,我得到一个错误,“数组必须都是相同的长度”。所以,我使用了上述方法。 – Rohit

回答

2

在这种情况下使用list对象的index方法:

frame.author[0].index('Deshpande, R.') 

我会建议寻找到过滤你的JSON之前,把它变成一个DataFrame这样你可以采取的是所有索引操作的优势可在熊猫中找到。看看这个问题并回答一个例子:Create a Pandas DataFrame from deeply nested JSON