我需要从一个.json文件导入的数据集中额外添加一个要素。从熊猫数据框中提取字典值
这是什么样子:
f1 = pd.read_json('https://raw.githubusercontent.com/ansymo/msr2013-bug_dataset/master/data/v02/eclipse/short_desc.json')
print(f1.head())
short_desc
1 [{'when': 1002742486, 'what': 'Usability issue...
10 [{'when': 1002742495, 'what': 'API - VCM event...
100 [{'when': 1002742586, 'what': 'Would like a wa...
10000 [{'when': 1014113227, 'what': 'getter/setter c...
100001 [{'when': 1118743999, 'what': 'Create Help Ind...
从本质上说,我需要“SHORT_DESC”作为列名,并用字符串值正下方填充它:“可用性问题...
到目前为止,我已经试过如下:
f1['desc'] = pd.DataFrame([x for x in f1['short_desc']])
Wrong number of items passed 19, placement implies 1
是否有一个简单的方法来做到这一点,而不使用循环?有人能指出这个新手朝着正确的方向吗?
这就是让我疯狂的原因,为什么我们得到了1,10,100等等,没有'short_desc'和列标题。 – JohnWayne360
@ JohnWayne360因为你正在打印一系列作品。尝试'print(df.head())'。你会得到它。 –
@ JohnWayne360有趣的是,当你从网页链接加载它时,该索引似乎就出现了。想要重置它?做'f1 = f1.reset_index(drop = 1)' –