2016-01-01 88 views
3

我正在使用共享内存(shm_open/mmap)来跟踪某些状态。在我的共享内存我有结构:共享内存中的指针

typedef struct fim_t { 
    uint64_t num_procs; 
    uint64_t num_numa; 
    int64_t *numa_nodes[MAX_FIM_NUMA]; 
    int64_t procs[MAX_FIM_PROC]; 
}fim_t; 

我想要做的就是特效数组中加载进程ID,然后有numa_nodes阵列点特效数组值,所以我可以在一个地方操作的价值和它在所有参考文献中都有变化。我的理解是设置numa_nodes引用procs数组的地址不应该是内存访问冲突,因为它们的地址都完全在共享内存段内。然而,当我尝试访问这个值时,我得到一个seg错误,这个值告诉我我以前的陈述必须是错误的。

下面是示例代码:

int main(){ 
    int fd; 
    int init_flag = 0; 
    if((fd = shm_open("fim", O_RDWR | O_CREAT | O_EXCL, S_IRWXU)) > 0){ 
     printf("creating shared memory\n"); 
     init_flag = 1; 
    } else { 
     printf("opening shared memory\n"); 
     fd = shm_open("fim", O_RDWR, S_IRWXU); 
    } 
    if (-1 == fd) { 
     printf("fd is negative\n"); 
     abort(); 
    } 
    if ((1 == init_flag) && -1 == ftruncate(fd, sizeof(fim_t))){ 
     printf("ftruncate failed %d\n", errno); 
     abort(); 
    } 

    fim_t *fim = mmap(NULL, sizeof(fim_t), PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0); 
    if(MAP_FAILED == fim){ 
     printf("mmap failed\n"); 
     abort(); 
    } 
    if(init_flag){ 
     fim->num_procs = 1; 
     my_rank = 0; 
     for(int x=0;x<MAX_FIM_PROC;x++){ 
      fim->procs[x] = 0; 
     } 
     fim->numa_nodes[0] = &(fim->procs[0]); 
    } else { 
     my_rank = __sync_fetch_and_add(&(fim->num_procs),1); 
     fim->procs[my_rank] = my_rank; 
     fim->numa_nodes[0] = &(fim->procs[my_rank]); 
    } 
    printf("my rank is: %"PRId64"\n",my_rank); 
    sleep(5); 
    printf("my numa val is %"PRId64"\n",*fim->numa_nodes[0]); 
    printf("rank %"PRId64" is going down\n", my_rank); 
    // SHUTDOWN 
    uint64_t active = __sync_sub_and_fetch(&(fim->num_procs),1); 
    printf("num active is now %"PRId64"\n", active); 
    close(fd); 
    shm_unlink("fim"); 
    return 0; 
} 

我希望/希望发生的将是我运行一个进程,然后立即开始另一个和第一处理打印“我的NUMA val为1”是什么(由于第二个进程设置numa_node [0]的值)并且都干净地退出。但是,第二个进程运行正常,但是在numa_node [0]的打印语句(睡眠之后)的第一个进程seg故障(内存访问)。

所以这里是我的问题:我做错了什么或者我的方法行不通?如果它不可行,是否有另一种方法来实现我期待的结果?

+1

每个进程将有一个不同的共享内存地址。如果您在一个进程中设置指针,它们将不会在另一个进程中有效。 – Barmar

回答

2

我的理解是,设置proc数组地址的numa_nodes引用不应该是内存访问冲突,因为它们的地址都完全在共享内存段内。

问题是,不同的进程映射共享内存到不同地址。

fim_t *fim = mmap(NULL, sizeof(fim_t), PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0); 

fim将在不同的过程不同值。打印出来检查这一点。

这会导致指向int64_t procs[MAX_FIM_PROC]元素的指针在不同的进程中不同。

fim is <addr1> in process 1 
fim is <addr2> in process 2 

&fim->procs[0] will be different in two processes 

&fim->procs[0] is <addr1> + <offset> in process 1 
&fim->procs[0] is <addr2> + <offset> in process 2 

因为这些是不同的值,所以它们不能在进程之间共享。一个进程中的有效指针在另一个进程中无效。

有两种可能的解决方案。

  1. 力的共享存储器中映射到所有进程同一地址mmap有一个选项来完成此操作。然后,您可以跨进程共享指向共享内存中元素的指针。
  2. 不要共享共享内存中的指针。改为分享索引。
4

您没有做任何事情来安排共享内存的所有用户将它映射到相同的虚拟地址。一些* nix系统默认会这样做,但大多数不会。

要么尝试将您的段映射到固定地址(并处理失败 - 这可能不会成功) - 或将偏移量存储在共享内存中,而不是实际指针。