我已经写在MATLAB我自己的SHA1的实现,它给正确的哈希值。然而,它非常慢(我的Core i7-2760QM上的字符串1000 a
需要9.9秒),我认为这种慢度是由MATLAB如何实现按位逻辑运算(bitand
,bitor
,,bitcmp
)和按位整数的位移(bitshift
,bitrol
,bitror
)。如何优化MATLAB位操作
尤其是我不知道需要建造定点数值对象为bitrol
和bitror
使用fi
命令,因为反正在英特尔x86汇编有rol
和ror
既为各种规模的寄存器和存储器地址。然而,bitshift
速度相当快(它不需要任何定点数字结构,常规uint64
变量工作正常),这使情况变得陌生:为什么在MATLAB bitrol
和bitror
需要使用fi
构建的定点数字对象,而bitshift
不,当装配水平都归结到shl
,shr
,rol
和ror
?
因此,在C/C写这个函数++作为.mex文件之前,我很乐意知道是否有什么办法改善这种功能的性能。我知道对SHA1有一些特定的优化,但如果按位旋转的基本实现非常慢,那不是问题。
测试一点点与tic
和toc
,这是显而易见的是什么使得它慢是与bitrol
和fi
环。有两个这样的循环:
%# Define some variables.
FFFFFFFF = uint64(hex2dec('FFFFFFFF'));
%# constants: K(1), K(2), K(3), K(4).
K(1) = uint64(hex2dec('5A827999'));
K(2) = uint64(hex2dec('6ED9EBA1'));
K(3) = uint64(hex2dec('8F1BBCDC'));
K(4) = uint64(hex2dec('CA62C1D6'));
W = uint64(zeros(1, 80));
... some other code here ...
%# First slow loop begins here.
for index = 17:80
W(index) = uint64(bitrol(fi(bitxor(bitxor(bitxor(W(index-3), W(index-8)), W(index-14)), W(index-16)), 0, 32, 0), 1));
end
%# First slow loop ends here.
H = sha1_handle_block_struct.H;
A = H(1);
B = H(2);
C = H(3);
D = H(4);
E = H(5);
%# Second slow loop begins here.
for index = 1:80
rotatedA = uint64(bitrol(fi(A, 0, 32, 0), 5));
if (index <= 20)
% alternative #1.
xorPart = bitxor(D, (bitand(B, (bitxor(C, D)))));
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(1);
elseif ((index >= 21) && (index <= 40))
% FIPS.
xorPart = bitxor(bitxor(B, C), D);
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(2);
elseif ((index >= 41) && (index <= 60))
% alternative #2.
xorPart = bitor(bitand(B, C), bitand(D, bitxor(B, C)));
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(3);
elseif ((index >= 61) && (index <= 80))
% FIPS.
xorPart = bitxor(bitxor(B, C), D);
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(4);
else
error('error in the code of sha1_handle_block.m!');
end
temp = bitand(temp, FFFFFFFF);
E = D;
D = C;
C = uint64(bitrol(fi(B, 0, 32, 0), 30));
B = A;
A = temp;
end
%# Second slow loop ends here.
与tic
和toc
,消息的SHA1哈希整个计算abc
发生在我的笔记本电脑周围0.63秒,其中约0.23秒在第一个慢环和周围通过测量在第二个慢循环中为0.38秒。那么在编写.mex文件之前,有什么方法可以在MATLAB中优化这些循环?
在我看来,加速SHA1的选项是使用'java.security.MessageDigest'库或编写一个MEX函数。正如我打算让我的MATLAB代码与GNU Octave兼容(也希望将GNU Octave用作开发环境),并且似乎在处理Java和Octave之间存在一些差异,使用Java库是一个非理想的解决方案。然而,'DataHash'非常快,因此在执行MEX解决方案之前就可以完成这项工作,或者找到另一种有效实现SHA1的方法,而无需使用Java。 – nrz 2012-07-15 11:00:03
将我自己的fMRI分析工具箱移植到Octave是我的一个长期项目,我不想基于此来限制答案。无论如何,我目前需要的是一种有效的方式来计算大型文件(在MATLAB中)的SHA1,以便能够继续开发,'DataHash'是一个可行的解决方案。 – nrz 2012-07-15 11:34:01
@nrz:Octave具有兼容的MEX API来编写C扩展。他们也有自己的API来编写OCT文件(相当于MATLAB中的MEX文件)。 – Amro 2012-07-15 11:45:58