我是simd初学者,我读过this关于该主题的文章(因为我使用的是兼容AVX2的机器)。如何使用这个宏来测试内存是否对齐?
现在,我已阅读this问题,以检查指针是否对齐。
我与这个玩具例子main.cpp
测试它:
#include <iostream>
#include <immintrin.h>
#define is_aligned(POINTER, BYTE_COUNT) \
(((uintptr_t)(const void *)(POINTER)) % (BYTE_COUNT) == 0)
int main()
{
float a[8];
for(int i=0; i<8; i++){
a[i]=i;
}
__m256 evens = _mm256_set_ps(2.0, 4.0, 6.0, 8.0, 10.0, 12.0, 14.0, 16.0);
std::cout<<is_aligned(a, 16)<<" "<<is_aligned(&evens, 16)<<std::endl;
std::cout<<is_aligned(a, 32)<<" "<<is_aligned(&evens, 32)<<std::endl;
}
而且随着icpc -std=c++11 -o main main.cpp
编译。
所得印刷是:
1 1
1 1
但是,如果我的4个打印之前添加thhese 3行:
for(int i=0; i<8; i++)
std::cout<<a[i]<<" ";
std::cout<<std::endl;
这是结果:
0 1 2 3 4 5 6 7
1 1
0 1
特别,我不明白最后0
。为什么它与上次打印有所不同?我错过了什么?
谢谢您的回答。所以,为了确保我能够正确理解:让我们想象一下,我们可以将内存表示为连续的块,每个块都是4个字节(由'float'变量占用的空间)。编译器保证数组与这4个字节块对齐,所以数组从4个字节块的开始处开始。但不能保证数组从这个32字节块(这4个字节块中的8个)的块的开始处开始,但它可能偶然发生。那是对的吗? – cplusplusuberalles
另外一个问题:让我们假设我有一个具有'float *'作为输入参数的函数。我们不知道它是否对齐。我如何使它对齐? PS:让我知道是否更合适,我打开一个新的问题.. – cplusplusuberalles
@cplusplusuberalles 1.正确2.你当然可以使指针指向另一个对齐的内存地址,但你会怎么做这样的指针?考虑一个类似的问题:“我有一个函数有一个int输入参数,我们不知道它是否可以被2整除。”我怎样才能使它整除2?“。如果奇数,你可以加1,但就像在指针的情况下一样:这有用吗? – user2079303