2016-12-28 83 views
0

处理需要根据未索引(?)变量进行分组并经过滤的长列表中的数据的最佳方法是什么?字典和编程变量创建列表

我有字典的列表,看起来像这样(有多个键,但这些都是相关的)

[{'bol': True, 'location': 102, 'type': 39, 'value':293.3812}, ...] 

名单很长(500K给予或采取),我需要执行若干对其进行的操作包括;按'location'过滤,按'type'分组而不知道所有类型是什么,按'bol'分组,按'value'排序。我的最终目标是获得一个数据集(我想.xml也许?),每个'类型'将有2个值; 'bol'的最大'值'='bol'= False组的真实组和最小值。任何关于“最好”的方式来处理这个问题的建议?

+1

听起来像数据库的工作。 – ThisSuitIsBlackNot

回答

3

这听起来像是一个熊猫的工作!你知道吗?用python进行数据分析真的非常流行http://pandas.pydata.org/

我建议看看这个框架,因为你可以用你的数据构建一个数据框,然后你想要执行的操作是tipical数据框操作。

import pandas as pd 
df = pd.DataFrame(your_list) 
# filter bol == True only 
df = df.loc[df['bol'] == True] 
df['value'].max() 
+0

我还没有听说过它,但看起来正是我所需要的。谢谢! – kmdewey