我得到了很多很多文件上传到服务器,我只是想避免重复的方法。根据python中的文件内容创建一个唯一的密钥
因此,从一个大字符串生成一个唯一的小键值似乎是校验和的意图,hashing seemed like the evolution of that。
所以我打算使用散列md5来做到这一点。但后来我读somewhere“MD5并不是唯一的键”,我觉得这很奇怪。
这样做的正确方法是什么?
编辑:顺便说一下,我把twosources去以下,这是我当前如何做它和它的工作只是罚款,与Python 2.5:
import hashlib
def md5_from_file (fileName, block_size=2**14):
md5 = hashlib.md5()
f = open(fileName)
while True:
data = f.read(block_size)
if not data:
break
md5.update(data)
f.close()
return md5.hexdigest()
使用“f = open(fileName,'rb')”在Windows上获得正确的结果 – DLRdave 2012-01-05 15:04:59