2015-11-26 59 views
0

我试图褪色两个图像,结果不是预期的(早期使用C代码)。 这里是MMX代码:MMX:褪色的两个图像结果

void fadeMMX(ImagenBMP *imagen1, ImagenBMP *imagen2, int f) { 
double *puntero1; 
double *puntero2; 
int valor = (int)f*255; 
for (int i=0; i <imagen1->tamanyo; i+=4) //De 4 en 4, ya que leemos 4 pixels cada vez 
     { 
      puntero1 = (double*) &imagen1->datos[i]; 
      puntero2 = (double*) &imagen2->datos[i]; 
      _asm{ 
       /*Guardar Imagenes*/ 
       /*Imagen A*/ 
       mov esi, puntero1[0]//imagen 1, leer 
       mov edi, puntero1[0]//imagen 1, guardar 
       movq mm1, [esi] //guardamos A (32 bits) 
       punpcklbw mm2,mm1 //desempaquetamos A en mm2 
       /*Imagen B*/ 
       mov esi, puntero2[0]//imagen 2, leer 
       movq mm3, [esi] //guardamos B (32 bits) 
       punpcklbw mm4,mm3 //desempaquetamos B en mm4 

       //Guardamos el valor 
       movq mm0, valor  
       punpcklbw mm6,mm0 

       //Operaciones 
       psubsw mm2,mm4 //restamos B a A y guardamos en A 
       pmulhw mm2, mm6 //multiplicamos A * F y guardamos en A, los bits mas significativos 
       paddusw mm2, mm4 //sumamos lo que tenemos ahora en A mas lo que teniamos en B y guardamos en A 

       /*Empaquetar*/ 
       packsswb mm5, mm2 //empaquetamos en mm5 - saturacion con signo 
       movd [edi], mm5 //guardamos en memoria el nuevo valor 
      } 
} //end for 
_asm 
       { 
        emms //Finalizar utilización de registros MMX 
       }}; //end fadeMMX 

Resulting image of fadeMMX with f = 100

Expected image

+1

你为什么选择使用MMX和程序集的特定原因?使用内部函数的SSE实现将更容易编码,并且可能会使运行时间加快2倍。 –

+0

这是一个学校项目的做法,下面的练习是与SSE一起做,你能给我任何建议吗? @PaulR – danibeam

+1

对于SSE实现,我肯定会推荐使用内部函数而不是原始程序集。除此之外,它可能与MMX方法非常相似,期望每循环迭代处理两倍的像素。查看StackOverflow的[tag:sse]标签中的一些问题和答案,以获取有用的想法。 –

回答

1

我就已经找到了 '答案':我忘了补充该行

mov edi, puntero2[0]//imagen 2, guardar 

要保存第二个图像插入指针。