我有类似的文件中的以下数据:数据提取:创建具有列表字典辞典在python
Name, Age, Sex, School, height, weight, id
Joe, 10, M, StThomas, 120, 20, 111
Jim, 9, M, StThomas, 126, 22, 123
Jack, 8, M, StFrancis, 110, 15, 145
Abel, 10, F, StFrancis, 128, 23, 166
的实际数据可能是100列和一百万行。
我所要做的是创建在以下模式的字典(在计算方面非常昂贵)
:school_data = {'StThomas': {'weight':[20,22], 'height': [120,126]},
'StFrancis': {'weight':[15,23], 'height': [110,128]} }
事情我想:
试用1
school_names = [] for lines in read_data[1:]: data = lines.split('\t') school_names.append(data[3]) school_names = set(school_names) for lines in read_data[1:]: for school in schools: if school in lines: print lines
试验2:
for lines in read_data[1:]: data = lines.split('\t') school_name = data[3] height = data[4] weight = data[5] id = data [6] x[id] = {school_name: (weight, height)}
以上两种方法是我试图继续进行但没有接近解决方案的方法。
什么其他列?它们是否与计算有关?或者您是否希望使用这些额外的列与您使用体重/身高(学校的团体价值)所做的相同? – Cadu