numa

    0热度

    1回答

    例如,在具有2个四核处理器的双套接字系统中,线程调度器是否尝试在同一处理器中保持线程来自同一进程?由于在进程中的线程具有大量共享内存访问的情况下,在不同处理器中交织不同进程的线程会降低性能。

    1热度

    2回答

    我有一个2个问题: (我)假设线程X在CPU运行Y.是否可以使用系统调用migrate_pages - 甚至更好move_pages(或他们的libnuma包装) - 将与X相关的页面移动到Y所连接的节点? 这个问题棱,因为这两个系统调用的第一个参数是PID(我需要每个线程的方法对于一些研发我做) (二)积极回答为(I)的情况下,我怎么能得到一些线程使用的所有页面?我的目标是,移动包含数组M []

    1热度

    2回答

    我想创建许多并行进程来利用32核心机器,但是当我看着顶部屏幕时,它只显示5个Python进程。这是我的代码: max_processes = min(len(corpus_paths), cpu_count()*2) __log.debug("Max processes being used: " + str(max_processes)) pool = Pool(max_processes)

    0热度

    1回答

    我正在阅读关于大型多核机器上多线程性能问题的文章: http://www.reddit.com/r/Python/comments/1mn12l/what_you_do_not_like_in_python/ccbc5h8 该文章的作者声称,在大规模多核系统中,多线程应用程序对多处理器应用程序具有更大的性能影响。 AFIAK多线程是便宜然后多现在(无论是在系统管理和上下文切换方面)。 为简单起见,

    3热度

    1回答

    我使用Red Had Linux在16核心NUMA机器上对Java程序进行了基准测试。我测量了Java DatagramSocket(对于UDP)的吞吐量,以每秒能够接收和发送的数据包数量(64字节大小)为单位。该程序由一个套接字和n个在套接字上监听的线程组成。当一个数据包到达时,他们会将有效载荷复制到一个byte []数组中,并使用该数组创建一个新的DatagramPacket,并将其直接发送回

    1热度

    2回答

    ,我应该禁用NUMA运行Windows Server 2008 R2 SP1。我正在运行的应用程序不是在考虑NUMA的情况下设计的。在我的双路系统上禁用NUMA会更好吗?我的猜测是肯定的,但我想证实。我的服务器是Westmere双路系统。

    0热度

    1回答

    我正在NUMA计算机中进行并行编程(我还没有计算机,计划很快到达)。 我在每个NUMA节点上都有一个工作线程池(处理器关联集合)和一个在池/节点之间均匀分布工作的平衡器。这是为了确保所有的内存分配都在本地内存上。这一切都很好,很棒。 启动期间,池工作线程从主线程创建,他们必须先做一些初始化设置,然后才能设置自己的亲和性(第三方库的要求,我无能为力)。 我担心会有隐藏的性能损失,因为工作线程的堆栈帧

    0热度

    1回答

    例如,有三个线程。 线程1分配的任务1,2,和3。 线程2被分配的任务4,5,和6 线程3被分配的任务7,图8和9 任务大小不统一。分配给线程的任务具有非常相似的工作集,因此当所有这三个任务都由同一个线程执行时,缓存将被有效地使用。我还应该注意到这些任务将在具有四个节点的NUMA系统上运行。四个线程中的每一个都必须分配给系统的一个节点。 我的问题是关于负载平衡。例如,如果线程1在其他任务和任务9未

    1热度

    1回答

    我正在检查点/重新启动Linux内核模块。其中,一个进程向这个模块发送一个请求给自己的检查点。在这个过程中,有关过程的信息存储在一个文件中,该文件稍后用于重新启动过程。 现在,当这个模块存储与在一个文件中(过程)页面的信息,我们也想知道哪个NUMA节点此页面被分配 你可以建议将得到最好的办法数据(页面到NUMA节点映射)。由于我在内核空间,我想使用Linux内核函数本身来获取这些信息。 我试过使用

    7热度

    1回答

    我的问题涉及JVM应用程序可以利用主机的NUMA布局的程度。 我有一个Akka应用程序,其中参与者通过将传入数据与已加载到不可变(Scala)对象的“通用”数据进行组合来并发处理请求。该应用可以在云中很好地扩展,使用许多双核虚拟机,但在单个64核心机器上执行效果不佳。我认为这是因为公共数据对象驻留在一个NUMA单元中,并且从其他单元并发访问的许多线程对于互连而言太多。 如果我运行64个单独的JVM