得到错误SIMD操作

我要计算k=0到k=100得到错误SIMD操作

A[j][k]=((A[j][k]-con*A[r][k])%2);

的，我在一些int temp[5] ，然后做A[j][k]-temp[]在SIMD什么错在行其给段错误下面的代码保存(con*A[r][k])__m128i m5=_mm_sub_epi32(*m3,*m4);

while((k+4)<100) 
{  
    __m128i *m3 = (__m128i*)A[j+k]; 

    temp[0]=con*A[r][k]; 
    temp[1]=con*A[r][k+1]; 
    temp[2]=con*A[r][k+2]; 
    temp[3]=con*A[r][k+3]; 

    __m128i *m4 = (__m128i*)temp; 
    __m128i m5 =_mm_sub_epi32(*m3,*m4); 
    (temp_ptr)=(int*)&m5; 
    printf("%ld,%d,%ld\n",A[j][k],con,A[r][k]); 

    A[j][k] =temp_ptr[0]%2; 
    A[j][k+1]=temp_ptr[1]%2; 
    A[j][k+2]=temp_ptr[2]%2; 
    A[j][k+3]=temp_ptr[3]%2; 

    k=k+4; 
}

来源

2012-05-01 abhinav

最有可能的是，你没有照顾对齐。 SIMD指令需要16字节对齐（请参阅this文章）。否则，你的程序将崩溃。

要么是对齐，要么是某处存在错误的索引，并且访问错误的内存。

来源

2012-05-01 19:14:07

没有为J，K的可能值，和r很难知道为什么，但最有可能你是overi ndexing你的阵列之一

来源

2012-05-01 18:41:47 Attila

它给这条线错误...... ___ m128i m5 = _mm_sub_epi32（* m3，* m4）; – abhinav

超过索引数组不是我检查它的问题 – abhinav

'A'的维度是什么？ 'j'和'r'的可能值是多少？ – Attila

如果你想实现：

for (k = 0; k < 100; k += 4) 
{ 
    A[j][k] = (A[j][k] - con * A[r][k]) % 2; 
}

，你想看到从SIMD一些好处，那么你需要做的这一切在SIMD，即不混合SIMD和标量代码。

例如（未经测试）：

const __m128i vcon = _mm_set1_epi32(con); 
const __m128i vk1 = _mm_set1_epi32(1); 
for (k = 0; k < 100; k += 4) 
{ 
    __m128i v1 = _mm_loadu_si128(&A[j][k]); // load v1 from A[j][k..k+3] (misaligned) 
    __m128i v2 = _mm_loadu_si128(&A[r][k]); // load v2 from A[r][k..k+3] (misaligned) 

    v2 = _mm_mullo_epi32(v2, vcon);   // v2 = con * A[r][k..k+3] 
    v1 = _mm_sub_epi32(v1, v2);    // v1 = A[j][k..k+3] - con * A[r][k..k+3] 
    v1 = _mm_and_si128(v1, vk1);   // v1 = (A[j][k..k+3] - con * A[r][k..k+3]) % 2 

    _mm_storeu_si128(&A[j][k], v1);   // store v1 back to A[j][k..k+3] (misaligned) 
}

注意：如果你能保证A的每一行排列，那么你可以改变对齐加载/存储（_mm_loadu_si128/_mm_storeu_si128），以平衡负载的16字节/商店（_mm_load_si128/_mm_store_si128） - 这会有助于提升性能，具体取决于您的目标CPU。

来源

2012-05-01 20:32:53

得到错误SIMD操作

回答

相关问题