2013-04-21 24 views
0

我有一个这样的名单在python:Python的列表中的分组由

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5)('b',6.5)] 

我需要它包含一个列表:

[(a,avg(6.5,6.5,-6.5),no.of_occurences_of_a),(b,avg(0.0,6.5,-6.5,6.5),no.of_occurences_of_b)] 

[(a,6.5/3,3)(b,6.5/4,4)] 

如何做到这一点?

+0

您的要求输出[(a,6.5/3,3)(b,6.5/4,4)]或[(a,6.5/3,3),(b,6.5/4,4)]? – Johnny 2013-04-21 19:36:01

回答

3

您可以使用itertools.groupby

In [19]: list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)] 

In [20]: from itertools import groupby 

In [21]: from operator import itemgetter 

In [22]: lis=[] 

In [23]: for k,v in groupby(list1,key=itemgetter(0)): 
    items=[x[1] for x in v] 
    lis.append((k, sum(items)/len(items), len(items))) 
    ....:  

In [24]: lis 
Out[24]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)] 

注意,以防list没有排序你已经先解决它使用itertools.groupby来得到想要的结果。

使用collections.defaultdict,这会为未排序的项目工作,以及:

In [25]: from collections import defaultdict 

In [26]: dic=defaultdict(list) 

In [27]: for k,v in list1: 
    ....:  dic[k].append(v) 
    ....:  

In [28]: dic 
Out[28]: defaultdict(<type 'list'>, {'a': [6.5, 6.5, -6.5], 'b': [0.0, 0.0, 6.5, -6.5, 6.5]}) 

In [29]: [(k,sum(v)/len(v),len(v)) for k,v in dic.items()] 
Out[29]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)] 
+0

这假定所有分组元素都是连续出现的。如果输入列表被混洗,您需要先对其进行排序。 – 2013-04-21 19:25:22

+0

谢谢你完美的作品 – 2013-04-21 19:25:52

+0

@poorsod你是对的,我已经添加了一个笔记抵消。 – 2013-04-21 19:29:34

1

使用itertools.groupby。通常它会一直一行代码,但它在你的情况有点麻烦,因为你需要消费群体的两倍,以获得平均长度:

list1 = [('a', 6.5), ('a', 6.5), ('a', -6.5), ('b', 0.0), 
     ('b', 0.0), ('b', 6.5), ('b', -6.5), ('b',6.5)] 

import itertools 
import operator 

fst = operator.itemgetter(0) 
snd = operator.itemgetter(1) 
result = [] 
for grouper, group in itertools.groupby(sorted(list1, key=fst), key=fst): 
    items = map(snd, group) 
    result.append((grouper, sum(items)/len(items), len(items))) 
1

丑陋的解决方案(不正确格式化为您要求的):

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)] 

a_list = [] 
b_list = [] 
a = 0 
b = 0 
for item in list1: 
    if 'a' in item: 
     a_list.append(item[1]) 
     a += 1 
    if 'b' in item: 
     b_list.append(item[1]) 
     b +=1 

#a is now the count of a's 
#b is now the count of b's 
a_avarage = reduce(lambda x, y: x + y, a_list) 
b_avarage = reduce(lambda x, y: x + y, b_list)