2014-05-12 50 views
0

我想熟悉汇编程序中的编程。在开始时我选择了随机代码并尝试更新它。我还阅读了一些关于循环展开的内容,但我不知道从哪里开始。代码优化和循环展开

这是我的代码,我已经修改了一下:

0000: 4401000C |   | ADDI R0, 0x000C, R1 
0004: 00000000 |   | NOP 
0008: 00000000 |   | NOP 
000C: 0C220000 | loop  | LDW R2, 0x0000(R1) 
0010: 00000000 |   | NOP 
0014: 00000000 |   | NOP 
0018: 1C411000 |   | ADD R2, R1, R2 
001C: 00000000 |   | NOP 
0020: 00000000 |   | NOP 
0024: 4C420004 |   | MULI R2, 0x0004, R2 
0028: 00000000 |   | NOP 
002C: 00000000 |   | NOP 
0030: 18220040 |   | STW R2, 0x0040(R1) 
0034: 48210008 |   | SUBI R1, 0x0008, R1 
0038: 00000000 |   | NOP 
003C: 00000000 |   | NOP 
0040: 0C230004 |   | LDW R3, 0x0004(R1) 
0044: 00000000 |   | NOP 
0048: 00000000 |   | NOP 
004C: 18230044 |   | STW R3, 0x0044(R1) 
0050: 7C01FFB8 |   | BRGE R1, loop 
0054: 00000000 |   | NOP 
0058: 00000000 |   | NOP 
005C: 7000FFFC | halt  | BRZ R0, halt 
0060: 00000000 |   | NOP 
0064: 00000000 |   | NOP 
+3

您可能要问一个实际的问题,这是习惯在这里 – Leeor

+0

这是一个很大的NOP ... – twalberg

+0

我想我知道如何使用循环展开,但我还是不知道如何改进代码 – NULLexit

回答

0

循环展开是出以创作的代码,如果它被称为是一个短环。这是为了节省使用分支需要很长时间的特别严重的流水线处理器的循环开销(冲洗和重新填充管道)。

基本上是:不是

for (i=0; i<3; i++) 
{ 
    a[i] = 0; 
} 

你做的只是:

a[0] = 0; 
a[1] = 0; 
a[2] = 0; 

我不认为你通过展开环增益什么。

+0

这在具有并行执行单元(如PowerPC或Itanium)的处理器体系结构中更为常见。如果指令布置正确,PowerPC可以在一个时钟周期内执行多个整数指令。这是否可以提高性能很大程度上取决于你在做什么。衡量,衡量,衡量。 – jbruni

+0

是的,我忘了提及。我会提到TI C64X DSP内核。 – turboscrew

0

我读了一些关于循环展开的内容,我想我明白了。你怎么看待下面的代码?

0000: 4401000C |   | ADDI R0, 0x000C, R1 
0004: 00000000 |   | NOP 
0008: 00000000 |   | NOP 
000C: 0C220000 | loop  | LDW R2, 0x0000(R1) 
0010: 0C24FFF8 |   | LDW R4, 0xFFF8(R1) 
0014: 0C23FFFC |   | LDW R3, 0xFFFC(R1) 
0018: 0C25FFF4 |   | LDW R5, 0xFFF4(R1) 
001C: 1C822000 |   | ADD R4, R2, R4 
0020: 1C411000 |   | ADD R2, R1, R2 
0024: 48210008 |   | SUBI R1, 0x0008, R1 
0028: 48260008 |   | SUBI R1, 0x0008, R6 
002C: 4C420004 |   | MULI R2, 0x0004, R2 
0030: 4C840004 |   | MULI R4, 0x0004, R4 
0034: 18230044 |   | STW R3, 0x0044(R1) 
0038: 18C50044 |   | STW R5, 0x0044(R6) 
003C: 18220048 |   | STW R2, 0x0048(R1) 
0040: 18C40048 |   | STW R4, 0x0048(R6) 
0044: 00000000 |   | NOP 
0048: 00000000 |   | NOP 
004C: 7000FFFC | halt  | BRZ R0, halt