numa

    1热度

    1回答

    在NUMA体系结构(非均匀内存访问)中,每个处理器都有自己的第一级缓存,所以有一个用于处理器通信的协议(MESI)。但为什么不能将每个处理器直接连接到其他的缓存?我读到“连接速度不够快”,但这并没有解释太多。 谢谢。

    2热度

    1回答

    我想写一个OpenCL的概念应用程序的证明,在特定的CPU上执行一个内核(因此可以在将来扩展为NUMA感知,并为内存分配内核在相应的NUMA节点上执行,如in the Intel Dev forums所示)。 不幸的是,Windows调度程序并不在乎我想要什么,因为它似乎通过所有可用的CPU核心(因此远离本地内存)来循环我的内核。 我现在使用CL_DEVICE_PARTITION_BY_COUNT

    0热度

    1回答

    我尝试使用numa_alloc_onnode()通过运行下面的代码在32GB节点上分配40GB的内存。但它不会报告任何错误。 a = (int *) numa_alloc_local (sizeof(int) * GB_8 * 5); if (a == NULL) printf("a error\n"); for (i = 0; i <GB_8*5; i++) a[i] =

    5热度

    1回答

    我正在研究Linux环回和IP网络数据处理,而且似乎没有代码可以涵盖2个不同套接字上的CPU通过环回传递数据的情况。 我认为应该有可能检测到这种情况,然后应用硬件DMA,以避免NUMA争用将数据复制到接收器。 我的问题是: 我是正确,这不是目前在Linux中做了什么? 我认为这是可能的正确轨道? 我应该研究哪些内核API或现有驱动程序来帮助完成这样的环回版本?

    1热度

    4回答

    我目前正在使用NUMA机器。我正在使用​​来释放我分配的内存。但是,与free不同,​​需要知道要释放多少个字节。有什么方法可以知道一个指针指向了多少个字节而没有将它指出来?

    1热度

    2回答

    我正在AMD阿布扎比架构上执行多线程程序,它有8个NUMA域。我正在使用numactl在不同核心中分配线程,并尝试使用不同的内存策略。我想测量由NUMA域安排的缓存未命中/命中,但是使用像perf这样的工具获得了总计数器。我已经浏览过numastat,likwid和hpctoolkit等工具。你知道有哪些工具可以获得由NUMA域隔开的标准性能计数器吗?

    0热度

    1回答

    是否有任何方式在Windows系统中,以(a)以编程方式查找网络适配器的NUMA节点而无需编写驱动程序或(b)读写网络适配器的接收方扩展选项,而无需编写一个司机? 最好的解决方案是(a)所以配置可以完全自动设置。

    1热度

    2回答

    最近的Linux版本默认启用NUMA平衡器吗?如果是这样,我怎么能禁用NUMA平衡器,请让我知道。

    0热度

    1回答

    NUMA支持哪个CPU?这种CPU的当前服务器配置是什么?关于什么是Linux NUMA命令,如何打开NUMA?

    3热度

    1回答

    在UMA机器上使用MPI有什么优势?在我看来,使用OpenMP和UMA机器会更有意义,因为它们共享内存。 MPI在NUMA机器上更有意义,因为NUMA为每个进程提供了自己的内存。