我有如下格式(〜88百万在所有):快速查找
userid age test value
111 33 SODIUM 140
111 34 POTASSIUM 4.1
333 65.4 CHLORIDE 107
444 24 BICARBONATE 24
我需要创建在最后一列的value
快速查找,鉴于前三个项目(即userid
,age
,test
)。
什么是反复查找到这个数据的最佳方式?一个是我想到的是创建一个字典,其中keys
是元组(userid
,age
,test
)和值value
。在过去,我使用类似的方法,这种方法对于更小的数据非常缓慢。
您使用数据库。不要在python中将8800万条记录加载到内存中。这是疯了/可笑。 –
LOL ......也许http://docs.python.org/2/library/string.html#string.split – ASPiRE
字典基于哈希表,这是一样快的Python可以得到的。如果这对你来说太慢了,你需要一种不同的方法。正如@MarcB所说的那样,数据库对于那些数据量更合适,但它会更慢。 –