numa

1热度

1回答

在NUMA体系结构（非均匀内存访问）中，每个处理器都有自己的第一级缓存，所以有一个用于处理器通信的协议（MESI）。但为什么不能将每个处理器直接连接到其他的缓存？我读到“连接速度不够快”，但这并没有解释太多。谢谢。

2热度

1回答

我想写一个OpenCL的概念应用程序的证明，在特定的CPU上执行一个内核（因此可以在将来扩展为NUMA感知，并为内存分配内核在相应的NUMA节点上执行，如in the Intel Dev forums所示）。不幸的是，Windows调度程序并不在乎我想要什么，因为它似乎通过所有可用的CPU核心（因此远离本地内存）来循环我的内核。我现在使用CL_DEVICE_PARTITION_BY_COUNT

0热度

1回答

numa_alloc_onnode（）分配内存多，然后它可以？

我尝试使用numa_alloc_onnode（）通过运行下面的代码在32GB节点上分配40GB的内存。但它不会报告任何错误。 a = (int *) numa_alloc_local (sizeof(int) * GB_8 * 5); if (a == NULL) printf("a error\n"); for (i = 0; i <GB_8*5; i++) a[i] =

5热度

1回答

通过环回来优化套接字数据传输NUMA

我正在研究Linux环回和IP网络数据处理，而且似乎没有代码可以涵盖2个不同套接字上的CPU通过环回传递数据的情况。我认为应该有可能检测到这种情况，然后应用硬件DMA，以避免NUMA争用将数据复制到接收器。我的问题是：我是正确，这不是目前在Linux中做了什么？我认为这是可能的正确轨道？我应该研究哪些内核API或现有驱动程序来帮助完成这样的环回版本？

1热度

4回答

如何获取指针指向的内存大小？

我目前正在使用NUMA机器。我正在使用来释放我分配的内存。但是，与free不同，需要知道要释放多少个字节。有什么方法可以知道一个指针指向了多少个字节而没有将它指出来？

1热度

2回答

测量Linux中NUMA节点缓存未命中/命中的工具？

我正在AMD阿布扎比架构上执行多线程程序，它有8个NUMA域。我正在使用numactl在不同核心中分配线程，并尝试使用不同的内存策略。我想测量由NUMA域安排的缓存未命中/命中，但是使用像perf这样的工具获得了总计数器。我已经浏览过numastat，likwid和hpctoolkit等工具。你知道有哪些工具可以获得由NUMA域隔开的标准性能计数器吗？