sse3

    1热度

    1回答

    我试图找到一种方法来读取文件与“间隙”的数组: 所以读取的数据是在位置buffer[0], buffer[2], .., buffer[2*i]字节数组buffer中,无任何显着的速度损失。 更具体地说,我想在整体上阅读它(即b[0], b[4], ..., b[i * 4])。 难道这是以任何方式(C#,C++)还是应该寻找另一种方法? 更多一点背景: 我试图加快散列算法(散列文件blockwi

    0热度

    1回答

    我不得不用AVX指令开发一个冒泡排序算法,输入中有单精度数字。任何人都可以帮助我寻找最佳实施? 我做了一个冒泡排序版本SSE3: global sort32 sort32: start mov eax, [ebp+8] ; float* x mov ebx, [ebp+12] ; int n call sort stop ; ---

    2热度

    1回答

    我有一个关于在GCC上编译x264版本的问题。 x264具有处理指令集(如SSE3和SSSE3)的汇编代码,默认情况下在makefile中禁用自动矢量化。 无论如何我应该用-mssse3标志编译它还是可能实际上导致性能损失? 而且-mssse3暗示-msse3或SSE3是否与SSSE3分开?

    3热度

    2回答

    我一直在试图重新实现一些现有的向量和矩阵类来使用SSE3命令,而且我似乎遇到这些“内存访问冲突”错误,只要我执行一系列对一组向量的操作。我对SSE比较陌生,所以我从简单开始。这是我的矢量类的全部: class SSEVector3D { public: SSEVector3D(); SSEVector3D(float x, float y, float z);

    4热度

    1回答

    我试图从 http://www.cs.au.dk/~asand/?page_id=152 在C工作的一些隐马尔可夫代码++使用HMMlib库我使用的是Ubuntu的12.04,与GCC/G ++ 4.6 我的编译步骤的指令是: g++ -I/usr/local/boost_1_52_0 -I../ MAIN.cpp 这将产生以下错误: In file included from ../HM

    5热度

    2回答

    我有一个使用SSSE3内在命令(注意三重S)和运行时检查是否使用它的代码,因此我假定应用程序应该在CPU上执行而无需SSSE3支持。 但是,当使用-mssse3和-O1优化时,编译器还插入了我没有明确调用的SSSE3指令,因此程序崩溃。 当我明确地调用相关的内部函数但是停止编译器添加自己的SSSE3代码时,是否有方法来启用SSSE3代码? 请注意,我无法禁用-O1优化。

    2热度

    1回答

    我最近开始使用ROS,遇到了一个问题。我需要使用一些需要SSE2,SSE3和SSSE3 CPU扩展的类。 我想修改我的ROS包的manifest.xml文件像 <package> <description brief="topological_map_v1"> topological_map_v1 </description> <author>me</aut

    1热度

    1回答

    我正在编写一个程序,使用SSE指令来增加和增加整数值。我用浮点数做了同样的程序,但我缺少整数版本的instruccion。 用浮漂,我已经完成了我的所有操作后,我返回去值回常规int数组做: _mm_store_ps(temp4,temp3); temp4是float *和TEMP3一个__m128。 问题是,我找不到一个相似的内部整合者。我应该如何将值返回给常规数组? 非常感谢您的回答;)

    10热度

    3回答

    我遇到此错误的问题:“未启用SSE指令集”。我怎么能弄明白这一点? 我有ACER i7,Ubuntu 11.10,请任何人都可以帮到我吗? 任何帮助将不胜感激! 还运行: sudo cat /proc/cpuinfo | grep flags 给出: flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat ps

    3热度

    1回答

    我有一个应用程序是专为使用SSE到AVX的Sandbridge处理器设计的,现在我想让相同的应用程序在Atom处理器上运行。 我最近浏览网络为Atom cloverview处理器的内在支持。它提到它支持SSE3。 但是这意味着它支持SSE3或补充SSE3包含在SSE3中。 在Intel Atom架构手册中,它表示所有Atom处理器都支持SSE3和SSSE3以上的单指令多数据扩展。 有人可以给我一些