intel

    3热度

    1回答

    我想了解哪些事件可以在我的 CPU(Sandy Bridge)上具有精确修饰符。 英特尔软件开发人员手册(表18-32 PEBS性能 活动为英特尔®微代码名称的Sandy Bridge)包含 仅下列事件:INST_RETIRED,UOPS_RETIRED, BR_INST_RETIRED,BR_MISP_RETIRED,MEM_UOPS_RETIRED, MEM_LOAD_UOPS_RETIRED

    3热度

    1回答

    以下是我的代码。 hex2dec中的块可成功将单个十六进制数转换为十进制数。如果有人能够指出我在使用阵列时出错的地方,那将会非常有帮助。谢谢。 DATA SEGMENT NUM DW 1234H,9H,15H RES DB 3*10 DUP ('$','$','$') SIZE DB 3 DATA ENDS CODE SEGMENT ASSUME DS

    0热度

    1回答

    我正在制作一个简单的温度传感器,根据温度来点亮两个LED中的一个。 由于某些原因,LED输出仅闪烁板载LED(Edison上的引脚13)一次。 我的温度输出工作正常,但我不知道为什么我的代码工作不正确。 此处的接线照片。 int temppin = 0; int ledhigh = 7; int ledlow = 8; void setup() { Serial.begin(

    1热度

    1回答

    我在阅读this关于如何使用Intel C++编译器和Intel Knights Landing上的AVX512支持编译C/C++代码的文档。 不过,我对这个部分有点困惑: -xMIC-AVX512:使用该选项生成AVX-512F,AVX-512CD,AVX-512ER和AVX-512FP。 -xCORE-AVX512:使用此选项可生成AVX-512F,AVX-512CD,AVX-512BW,AV

    1热度

    1回答

    英特尔VTune放大器可以分析执行的并行应用程序on a remote machine。 Intel Advisor没有这样的选项。据this文件,你必须使用英特尔顾问的命令行版本: 这使得很多任务自动化,以及分析的 应用上远程主机 运行 但是,GUI版本有很多cl版本没有提供的功能(如关于如何解决矢量化/多线程低效率的建议等)。 我试图在远程计算机上运行​​,然后在本地复制项目(并生成结果)。它

    1热度

    2回答

    考虑我有一个SSE阵列具有16位的数据: {1,2,3,4,5,6,7,8} 现在我需要通过只存储低位字节此SSE数组转换成8个数据在像第一8个字节的16个的数据: {1,2,3,4,5,6,7,8,0,0,0,0,0,0,0,0}. 是否有任何SSE指令来执行此操作?

    2热度

    2回答

    我花了TBB矩阵乘法从here 此示例使用blocked_range为parallel_for时循环的概念。我还运行了一些使用英特尔MKL和特征库的程序。当我比较这些实现所用的时间时,对于各种矩阵大小(2-4096),MKL是最快的,而TBB是最慢的(平均比特征慢10倍)。这是正常的还是我做错了什么?至少TBB不应该比Eigen表现更好?

    0热度

    1回答

    我有一个在Intel平台上工作的OpenCL C++代码。我确实有一个想法,即在Kernel End的结构中不接受指针。不过,我有一个使用其中的自引用指针选项的类。现在,我可以使用一个结构并在主机端复制相同的结构,但我无法在设备端执行相同的操作。 例如如下: Class Classname{ Classname *SameClass_Selfreferencingpointer;

    -1热度

    1回答

    我需要启用虚拟化,因为我遇到了virtualbox问题。这是另一个话题,手头的话题是我想启用虚拟化,但在我的BIOS中没有这样的选项。我的电脑是HP TouchSmart 600; CPU是 “英特尔Core 2 Duo P7450 CPU 2.13GHz的@ X2” Screenshot of About this PC in Ubuntu:

    2热度

    1回答

    我想从YMM复制值到RAX寄存器,但我没有找到正确的指令来做到这一点。我想要做类似的事情: mov rax, ymm0 例如对于XMM我可以这样做:movq rax, xmm0。我想要类似这样的东西。