如何使用这个宏来测试内存是否对齐？

我是simd初学者，我读过this关于该主题的文章（因为我使用的是兼容AVX2的机器）。如何使用这个宏来测试内存是否对齐？

现在，我已阅读this问题，以检查指针是否对齐。

我与这个玩具例子main.cpp测试它：

#include <iostream> 
#include <immintrin.h> 

#define is_aligned(POINTER, BYTE_COUNT) \ 
    (((uintptr_t)(const void *)(POINTER)) % (BYTE_COUNT) == 0) 


int main() 
{ 
    float a[8]; 
    for(int i=0; i<8; i++){ 
    a[i]=i; 
    } 
    __m256 evens = _mm256_set_ps(2.0, 4.0, 6.0, 8.0, 10.0, 12.0, 14.0, 16.0); 
    std::cout<<is_aligned(a, 16)<<" "<<is_aligned(&evens, 16)<<std::endl; 
    std::cout<<is_aligned(a, 32)<<" "<<is_aligned(&evens, 32)<<std::endl; 

}

而且随着icpc -std=c++11 -o main main.cpp编译。

所得印刷是：

1 1 
1 1

但是，如果我的4个打印之前添加thhese 3行：

for(int i=0; i<8; i++) 
    std::cout<<a[i]<<" "; 
std::cout<<std::endl;

这是结果：

0 1 2 3 4 5 6 7 
1 1 
0 1

特别，我不明白最后0。为什么它与上次打印有所不同？我错过了什么？

来源

2017-04-26 cplusplusuberalles

您的is_aligned（它是一个宏而不是函数）决定对象是否已经对齐到特定的边界。它不确定对象类型的对齐要求。

编译器将保证浮点数组至少对齐浮点的对齐要求 - 通常为4. 32不是4的因子，因此不能保证数组是对齐的到32字节边界。但是，有很多内存地址可以被4和32整除，所以有可能4字节边界上的内存地址碰巧也是32字节边界。这是你第一次测试中发生的事情，但正如所解释的，不能保证它会发生。在你的后一个测试中，你添加了一些局部变量，并且数组结束了另一个内存位置。恰巧另一个内存位置不在32字节边界。

要申请可以通过SIMD指令所要求的更严格的对齐方式，您可以使用alignas符：

alignas(32) float a[8];

来源

2017-04-26 10:38:56 user2079303

谢谢您的回答。所以，为了确保我能够正确理解：让我们想象一下，我们可以将内存表示为连续的块，每个块都是4个字节（由'float'变量占用的空间）。编译器保证数组与这4个字节块对齐，所以数组从4个字节块的开始处开始。但不能保证数组从这个32字节块（这4个字节块中的8个）的块的开始处开始，但它可能偶然发生。那是对的吗？ – cplusplusuberalles

另外一个问题：让我们假设我有一个具有'float *'作为输入参数的函数。我们不知道它是否对齐。我如何使它对齐？ PS：让我知道是否更合适，我打开一个新的问题.. – cplusplusuberalles

@cplusplusuberalles 1.正确2.你当然可以使指针指向另一个对齐的内存地址，但你会怎么做这样的指针？考虑一个类似的问题：“我有一个函数有一个int输入参数，我们不知道它是否可以被2整除。”我怎样才能使它整除2？“。如果奇数，你可以加1，但就像在指针的情况下一样：这有用吗？ – user2079303

如何使用这个宏来测试内存是否对齐？

回答

相关问题