MMX：褪色的两个图像结果

我试图褪色两个图像，结果不是预期的（早期使用C代码）。这里是MMX代码：MMX：褪色的两个图像结果

void fadeMMX(ImagenBMP *imagen1, ImagenBMP *imagen2, int f) { 
double *puntero1; 
double *puntero2; 
int valor = (int)f*255; 
for (int i=0; i <imagen1->tamanyo; i+=4) //De 4 en 4, ya que leemos 4 pixels cada vez 
     { 
      puntero1 = (double*) &imagen1->datos[i]; 
      puntero2 = (double*) &imagen2->datos[i]; 
      _asm{ 
       /*Guardar Imagenes*/ 
       /*Imagen A*/ 
       mov esi, puntero1[0]//imagen 1, leer 
       mov edi, puntero1[0]//imagen 1, guardar 
       movq mm1, [esi] //guardamos A (32 bits) 
       punpcklbw mm2,mm1 //desempaquetamos A en mm2 
       /*Imagen B*/ 
       mov esi, puntero2[0]//imagen 2, leer 
       movq mm3, [esi] //guardamos B (32 bits) 
       punpcklbw mm4,mm3 //desempaquetamos B en mm4 

       //Guardamos el valor 
       movq mm0, valor  
       punpcklbw mm6,mm0 

       //Operaciones 
       psubsw mm2,mm4 //restamos B a A y guardamos en A 
       pmulhw mm2, mm6 //multiplicamos A * F y guardamos en A, los bits mas significativos 
       paddusw mm2, mm4 //sumamos lo que tenemos ahora en A mas lo que teniamos en B y guardamos en A 

       /*Empaquetar*/ 
       packsswb mm5, mm2 //empaquetamos en mm5 - saturacion con signo 
       movd [edi], mm5 //guardamos en memoria el nuevo valor 
      } 
} //end for 
_asm 
       { 
        emms //Finalizar utilización de registros MMX 
       }}; //end fadeMMX

Resulting image of fadeMMX with f = 100

Expected image

来源

2015-11-26 danibeam

你为什么选择使用MMX和程序集的特定原因？使用内部函数的SSE实现将更容易编码，并且可能会使运行时间加快2倍。 –

这是一个学校项目的做法，下面的练习是与SSE一起做，你能给我任何建议吗？ @PaulR – danibeam

对于SSE实现，我肯定会推荐使用内部函数而不是原始程序集。除此之外，它可能与MMX方法非常相似，期望每循环迭代处理两倍的像素。查看StackOverflow的[tag：sse]标签中的一些问题和答案，以获取有用的想法。 –

我就已经找到了 '答案'：我忘了补充该行

mov edi, puntero2[0]//imagen 2, guardar

要保存第二个图像插入指针。

来源

2015-11-26 15:55:07 danibeam

MMX：褪色的两个图像结果

回答

相关问题