intrinsics

    2热度

    4回答

    我有这样的代码: __asm jno no_oflow overflow = 1; __asm no_oflow: 它生产这个漂亮的警告: 错误C4235:非标准扩展使用:不支持在此架构 '__asm' 关键字 会是什么是这个代码的等价/可接受的替代品来检查之前发生的减法操作的溢出吗?

    12热度

    1回答

    _mm_mwait从pmmintrin.h是如何工作的? (我的意思是不是它的ASM,但动作和这个动作是如何采取NUMA系统该store监测是很容易实现只在与公交车的监听总线为基础的SMP系统。) 什么处理器不执行它? 它用于某些自旋锁?

    7热度

    6回答

    是否有任何可以加速Core i7架构上双/整数矢量最小/最大值计算的asm指令? 更新: 我没想到会这么丰富的解答,谢谢。 所以我看到最大/最小值可能没有分支。 我有子问题: 有没有一种有效的方法来获得最大的双数的索引?

    10热度

    4回答

    这与ARM霓虹灯SIMD编码特别相关。我在视频解码器中为某些模块使用ARM Neon内置函数。我有一个矢量化的数据如下: 在氖灯寄存器中有四个32位元素 - 比方说Q0,它的大小为128位。 3B 3A 1B 1A 在其他氖灯寄存器中还有另外四个32位元素,说Q1大小为128位。 3D 3C 1D 1C 我想最终的数据是为了如下图所示: 1D 1C 1B 1A 3D 3C 3B 3A

    2热度

    4回答

    我曾经见过这个宏,但从未真正知道它的目的。任何人都可以阐明这一点吗?

    9热度

    4回答

    以下代码在GCC中调用clz/ctz的内置函数,并在其他系统上调用C版本。显然,如果系统具有像x86和ARM这样的内置clz/ctz指令,那么C版本就不太理想。 #ifdef __GNUC__ #define clz(x) __builtin_clz(x) #define ctz(x) __builtin_ctz(x) #else static uint32_t ALWAYS_INLINE

    0热度

    4回答

    我已经用蚂蚁描绘了我的应用程序,发现> 10%在CRC32计算中。 (该CRC32-计算在普通的C#实现) 我做了一些谷歌搜索,并了解在Visual Studio 2008中的以下内在函数: _mm_crc32_u8 _mm_crc32_u16 _mm_crc32_u32 _mm_crc32_u64 (http://msdn.microsoft.com/en-us/library/bb514036