2012-12-27 64 views
5
float a[4] = {1,2,3,4}, b[4] = {4,3,2,1}; 
uint32_t c[4]; 

int main() { 

    __m128 pa = _mm_loadu_ps(a); 

    __m128 pb = _mm_loadu_ps(b); 
    __m128 pc = _mm_cmpgt_ps(pa, pb); 
    _mm_storeu_ps((float*)c, pc); 
    for (int i = 0;i < 4; ++i) printf("%u\n", c[i]); 
    return 0; 
} 

什么是_mm_storeu_ps((float*)c, pc)的正确指令? 这里,c是一个整数数组...我不认为这种方式是好的,更好?如何将__m128转换为整数

+0

我的眼睛......他们伤害......我查过一次,那'__m128'憎恶是不是在C++标准。 –

回答

7

有两个指令以转换__m128float载体中)进入__m128iint32_t矢量)在SSE2:_mm_cvtps_epi32(舍入),并_mm_cvttps_epi32(带截断)。

__m128i vi = _mm_cvttps_epi32(pc); 
_mm_storeu_si128((__m128i *)c, vi); 

如果您不能使用SSE2,你应该存储pcfloat阵列后转换float阵列int阵列。

float d[4]; 
_mm_storeu_ps(d, pc); 
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];