我使用的是带有Unicode字符串的Delphi 2009。编码超大文件时如何解决此EOutOfMemory异常?
我试图编码非常大的文件,将其转换为Unicode:
var
Buffer: TBytes;
Value: string;
Value := Encoding.GetString(Buffer);
这工作得很好,可推动在规模扩大了一倍40 MB缓冲区,并返回值作为80 MB Unicode字符串。
当我尝试300 MB缓冲区时,它给我一个EOutOfMemory异常。
那么,这并非完全意外。但我决定无论如何追踪它。
它进入系统单元的DynArraySetLength过程。在那个过程中,它进入堆并调用ReallocMem。令我惊讶的是,它成功分配了665,124,864字节!
但随后朝着DynArraySetLength年底,它调用FillChar:
// Set the new memory to all zero bits
FillChar((PAnsiChar(p) + elSize * oldLength)^, elSize * (newLength - oldLength), 0);
您可以通过什么是应该做的评论看。这个例程没有太多,但这是导致EOutOfMemory异常的例程。这里是从系统单位FillChar:
procedure _FillChar(var Dest; count: Integer; Value: Char);
{$IFDEF PUREPASCAL}
var
I: Integer;
P: PAnsiChar;
begin
P := PAnsiChar(@Dest);
for I := count-1 downto 0 do
P[I] := Value;
end;
{$ELSE}
asm // Size = 153 Bytes
CMP EDX, 32
MOV CH, CL // Copy Value into both Bytes of CX
JL @@Small
MOV [EAX ], CX // Fill First 8 Bytes
MOV [EAX+2], CX
MOV [EAX+4], CX
MOV [EAX+6], CX
SUB EDX, 16
FLD QWORD PTR [EAX]
FST QWORD PTR [EAX+EDX] // Fill Last 16 Bytes
FST QWORD PTR [EAX+EDX+8]
MOV ECX, EAX
AND ECX, 7 // 8-Byte Align Writes
SUB ECX, 8
SUB EAX, ECX
ADD EDX, ECX
ADD EAX, EDX
NEG EDX
@@Loop:
FST QWORD PTR [EAX+EDX] // Fill 16 Bytes per Loop
FST QWORD PTR [EAX+EDX+8]
ADD EDX, 16
JL @@Loop
FFREE ST(0)
FINCSTP
RET
NOP
NOP
NOP
@@Small:
TEST EDX, EDX
JLE @@Done
MOV [EAX+EDX-1], CL // Fill Last Byte
AND EDX, -2 // No. of Words to Fill
NEG EDX
LEA EDX, [@@SmallFill + 60 + EDX * 2]
JMP EDX
NOP // Align Jump Destinations
NOP
@@SmallFill:
MOV [EAX+28], CX
MOV [EAX+26], CX
MOV [EAX+24], CX
MOV [EAX+22], CX
MOV [EAX+20], CX
MOV [EAX+18], CX
MOV [EAX+16], CX
MOV [EAX+14], CX
MOV [EAX+12], CX
MOV [EAX+10], CX
MOV [EAX+ 8], CX
MOV [EAX+ 6], CX
MOV [EAX+ 4], CX
MOV [EAX+ 2], CX
MOV [EAX ], CX
RET // DO NOT REMOVE - This is for Alignment
@@Done:
end;
{$ENDIF}
所以我的记忆被分配,但它坠毁试图用零填充它。这对我没有意义。就我而言,内存甚至不需要用零来填充 - 无论如何这可能是浪费时间的 - 因为无论如何Encoding语句都将填充它。
我可以以某种方式防止德尔福做记忆填充吗?
或者有没有其他方法可以让Delphi为我成功分配这个内存?
我的真正目标是为我的非常大的文件做这个Encoding语句,所以任何解决方案,这将是非常赞赏。
结论:请参阅我对答案的评论。
这是在调试汇编代码时要小心的警告。确保你在所有的“RET”行中都被打破,因为我错过了FillChar例程中的一个,并错误地推断FillChar导致了这个问题。感谢梅森,指出这一点。
我将不得不将输入分解为块以处理非常大的文件。
很高兴我能帮上忙。 :) – 2010-06-29 03:13:21