我一直在寻找我的答案,可能只是没有使用正确的措辞,只能拿出列表作为字典键值。字典作为关键值?
我需要20个csv文件和anonomyze标识学生,老师,学校和地区的信息用于研究测试数据。 csv文件的范围从20K到50K行和11到20列,并不都具有相同的信息。
一个文件可能有:
studid, termdates, testname, score, standarderr
而另一位可能有:
termdates, studid, studfirstname, studlastname, studdob, ethnicity, grade
而另一个可能:
termdates, studid, teacher, classname, schoolname, districtname
我把不同的数据到字典对于每种类型的文件/数据集,也许这不是最好的,但是当我尝试使用字典时,我陷入了困境用于当学生可以采取多个测试的密钥值即语言,阅读,数学等
例如:
studDict{studid{'newid': 12345, 'dob': 1/1/1, test1:{'score': 50, 'date': 1/1/15}, test2:{'score': 50, 'date': 1/1/15}, 'school': 'Hard Knocks'},
studid1{'newid': 12345, 'dob': 1/1/1, test1:{'score': 50, 'date': 1/1/15}, test2:{'score': 50, 'date': 1/1/15}, 'school': 'Hard Knocks'}}
的方法在其上库中的任何指导或短暂的方向将不胜感激。我了解足够多的Python,我不需要全面掌控,但帮助我穿过街道会很棒。 :d
澄清
我买彩票中奖超过这个项目确实被多次使用,所以简单的方法更好的一个更好的机会。如果这将是一个重复的项目,我很可能将数据转储到数据库表中并从那里开始工作。
尝试sqldict Python模块,它可以帮助你 – sudhishkr
“这个项目将永远不会被使用一次以上,所以我只是一起破解它“似乎是用来确保为公司构建新核心产品的关键短语 –
它通过另一个部门通过另一个部门部门,他们需要'昨天'大声笑。 – bmeredith