0
我试图褪色两个图像,结果不是预期的(早期使用C代码)。 这里是MMX代码:MMX:褪色的两个图像结果
void fadeMMX(ImagenBMP *imagen1, ImagenBMP *imagen2, int f) {
double *puntero1;
double *puntero2;
int valor = (int)f*255;
for (int i=0; i <imagen1->tamanyo; i+=4) //De 4 en 4, ya que leemos 4 pixels cada vez
{
puntero1 = (double*) &imagen1->datos[i];
puntero2 = (double*) &imagen2->datos[i];
_asm{
/*Guardar Imagenes*/
/*Imagen A*/
mov esi, puntero1[0]//imagen 1, leer
mov edi, puntero1[0]//imagen 1, guardar
movq mm1, [esi] //guardamos A (32 bits)
punpcklbw mm2,mm1 //desempaquetamos A en mm2
/*Imagen B*/
mov esi, puntero2[0]//imagen 2, leer
movq mm3, [esi] //guardamos B (32 bits)
punpcklbw mm4,mm3 //desempaquetamos B en mm4
//Guardamos el valor
movq mm0, valor
punpcklbw mm6,mm0
//Operaciones
psubsw mm2,mm4 //restamos B a A y guardamos en A
pmulhw mm2, mm6 //multiplicamos A * F y guardamos en A, los bits mas significativos
paddusw mm2, mm4 //sumamos lo que tenemos ahora en A mas lo que teniamos en B y guardamos en A
/*Empaquetar*/
packsswb mm5, mm2 //empaquetamos en mm5 - saturacion con signo
movd [edi], mm5 //guardamos en memoria el nuevo valor
}
} //end for
_asm
{
emms //Finalizar utilización de registros MMX
}}; //end fadeMMX
Resulting image of fadeMMX with f = 100
你为什么选择使用MMX和程序集的特定原因?使用内部函数的SSE实现将更容易编码,并且可能会使运行时间加快2倍。 –
这是一个学校项目的做法,下面的练习是与SSE一起做,你能给我任何建议吗? @PaulR – danibeam
对于SSE实现,我肯定会推荐使用内部函数而不是原始程序集。除此之外,它可能与MMX方法非常相似,期望每循环迭代处理两倍的像素。查看StackOverflow的[tag:sse]标签中的一些问题和答案,以获取有用的想法。 –