Python - 字典中各个键的每个值的均值

我在跨整个字典进行迭代时遇到问题，无法对键的值中的每个元素进行简单的汇总统计（平均值）。Python - 字典中各个键的每个值的均值

我的字典由那些号码清单键和值：

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]}

我知道，我可以访问每一个关键的第一个值，例如，通过执行以下，但我有麻烦明显的下一步是添加另一个for循环来遍历值中的所有元素。

location1=[element[0] for element in test_dict.values()] 
location1_avg=sum(location1)/len(location1)

我的最终目标是有标签的字典作为键（位置1 ... i）和各州该位置的平均值。所以第一个键值就是Location1：40，依此类推。

我有下面的尝试，但错误消息是'列表索引超出范围'，我不知道如何在这种情况下正确迭代。

for element in test_dict.values(): 
    avg=list() 
    for nums in element[i]: 
     avg[i]=sum(element[i][nums])/len(element[i][nums])

添加每请求

soln_dict={'Location1':40,'Location2':351,'Loction3':24,'Loction4':43.24,'Loction5':54}

感谢您的帮助所需的输出！

来源

2017-09-23 Z_D

你能说出你期望得到'test_dict'的结果吗？ – mkrieger1

@ Jean-FrançoisFabre我怀疑40应该是20,10和90的平均值，所以期望的结果可能是5个数字的列表，而不是带有3个键的字典。 – mkrieger1

你说得对 - 所需的输出是一个包含5个键值对的字典。第一个将是位置1：40 –

只是别：

#loop through the dictionary 
for key,value in test_dict.items(): 

    #use reduce to calculate the avg 
    print(key, reduce(lambda x, y: x + y, test_dict[key])/len(test_dict[key]))

这将打印：

NJ 66.0 
NY 33.8 
CT 220.08

编辑：根据变化我ñOP要求：

l = list(iter(test_dict.values()))      #convert values to list 
print(l) 
#[[20, 50, 70, 90, 100], [10, 3, 0, 99, 57], [90, 1000, 2, 3.4, 5]] 
d={}                 #final ditionary 
for i in range(len(l[0])): 
    row_list = [row[i] for row in l]      #get values column-wise 
    d['location'+str(i+1)] = sum(row_list)/len(row_list)    #calculate avg 

print(d) 
#{'location1': 40.0, 'location2': 351.0, 'location3': 24.0, 'location4': 64.13333333333334, 'location5': 54.0}

注意：您已经把有问题的loaction4平均是错误的。

来源

2017-09-23 17:50:57

谢谢 - 我的真实愿望，正如现在更好地解释的，是为每个值的每个第一个元素求平均值。请参阅所需的输出 - 感谢您的帮助。 –

@Tony，检查编辑 –

我对这个解决方案的保留意见是，它使用整数索引来遍历数据，这不像Pythonic那样。但它有效，它有效地回答了这个问题。 – fralau

不知道你的错误在哪里，但是i对于“使用没有用/有害的指数”是一个失败的赠品。

你的问题有直接的输入/输出数据流，并且是使用字典解析，迭代的关键，价值观和重建字典与平均值作为价值的完美匹配：

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]} 

result = {k:sum(x)/len(x) for k,x in test_dict.items()} 

print(result)

得到：

{'CT': 220.08, 'NJ': 66.0, 'NY': 33.8}

编辑：你似乎希望有一个“转”版本，匿名键，在这种情况下，只需要使用值的压缩版本：

result = {"location{}".format(i):sum(v)/len(v) for i,v in enumerate(zip(*test_dict.values()),1)}

给出：

{'location3': 24.0, 'location5': 54.0, 'location1': 40.0, 'location2': 351.0, 'location4': 64.13333333333334}

来源

2017-09-23 17:46:01

谢谢 - 这是一个很好的方式来做到这一点。但是，我希望的输出是获取键的每个元素的平均值。请参阅编辑所需的输出。 –

检查我的更新解决方案。仍然是一个班轮 –

你可以这样做：

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]} 
avg=[sum(element)/len(element) for element in test_dict.values()] 
print(avg) # => [66.0, 33.8, 220.08]

而对于一个字典：

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]} 
avg={ k:sum(test_dict[k])/len(test_dict[k]) for k in test_dict} 
print(avg) # => {'NJ': 66.0, 'NY': 33.8, 'CT': 220.08}

答案给编辑的问题：

如果该数组总是有长度为5，使用：

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]} 
avg={} 
for i in range(5): 
    avg['Location'+str(i+1)] = sum(test_dict[k][i] for k in test_dict)/len(test_dict) 
print(avg)

输出：

{'Location1': 40.0, 'Location2': 351.0, 'Location3': 24.0, 'Location4': 64.13333333333334, 'Location5': 54.0}

来源

2017-09-23 17:46:39

谢谢，感谢您的帮助。期望的输出实际上是不同的 - 我现在在原始文章中更好地解释它。 –

@Tony数组总是有5的固定长度吗？ –

在这种情况下，是的。 –

为了保持尽可能简单，我我建议：

from statistics import mean 

test_dict={'NJ':[20,50,70,90,100],'NY':[10,3,0,99,57],'CT':[90,1000,2,3.4,5]} 

# put the data in a list of lists 
# (throw away the city names) 
l = [seq for seq in test_dict.values()] 


# put together 1st values, 2nd values, etc. 
r = [mean(i) for i in zip(*l)] 
print(r)

其中给出：

[40, 351, 24, 64.13333333333334, 54]

我分征服了：我把这个字典到列表的列表，并然后使用zip将“列”放在一起。由于zip需要用逗号分隔的参数而不是列表，因此我使用星号运算符（*）进行转换。

我不确定应该从哪里得到名单？它只是Location_ +索引号？（如果是，为什么不把它放在列表中？）

有关平均函数，请参阅statistics包（对于Python> 3.4）。否则你可以自己写：

mean = lambda l: reduce(lambda x, y: x+y, l)/len(l)

我从Finding the average of a list获取灵感。那也许有点神秘，并且可能已经更清晰地写出了一个没有reduce的函数，但是单行代码使复制和粘贴更容易。

如果您使用的是Python 3，请从functools导入reduce。

来源

2017-09-23 18:15:49 fralau

谢谢 - 正如现在所解释的，我真正的愿望是获得每个值中每个第一个元素的平均值。请参阅所需的输出 - 感谢您的帮助。 –

好的。这更容易。我会修改我的答案。 – fralau

好的，谢谢。 –

Python - 字典中各个键的每个值的均值

回答

相关问题