2014-01-15 64 views
3

我想知道由于某个函数导致的内存访问次数。为此,我正在使用pintool。在pintool中,我使用了pinatrace,但是它会生成一个巨大的文件(文件大小> 534 MB),包含整个程序的所有读写操作。但我想找出一个特定的功能。我还没有找到任何这样做的例子。请在这方面帮助我,或给我提供任何有用的链接。C++函数:内存访问次数

P.S:我在Linux上编译我的C++程序。

+0

我不熟悉pintool的输出格式,但我几乎可以肯定你可以给一些开关导致一个输出,你可以使用像grep,awk等标准工具解析输出。 如果您给我们一个样本输出,它可能会有所帮助。 – adrin

+0

使用nm(1)来获取函数的起始地址。也许反汇编功能来获得它的大小。 –

+0

@brianbeuning你能否详细说明一下?在哪里使用nm(1)? – Xara

回答

1

Cachegrind是Valgrind的一部分,测量(或者说模拟)高速缓存访​​问的数量以及高速缓存未命中(即对实际RAM的访问)。查找概览here

它可以输出一个带注释的代码版本,并且还可以在this format之间逐行写入缓存访问和缓存未命中数。

Valgrind包含在流行操作系统的包管理器中,易于安装。

下面是一个例子:

#include <random> 
#include <vector> 

int main() 
{ 
    std::vector<int> vec; 

    // Seed with a real random value, if available 
    std::random_device rd; 
    std::default_random_engine eng(rd()); 
    std::uniform_int_distribution<int> dist(1,10000); 

    for (std::size_t i = 0 ; i < 1000 ; ++i) 
    vec.push_back(dist(eng)); 

    for (auto &num : vec) 
    num *= 3; 

    return 0; 
} 
  1. 编译(请确保您使用-g选项)在cachegrind模式

    g++ -std=c++11 -W -Wall -g -o test test.cpp 
    
  2. 运行的valgrind

    valgrind --tool=cachegrind ./test 
    
  3. 运行cg_annotate工具:

    cg_annotate ./cachegrind.out.2543 /absolute/path/test.cpp 
    

这产生:

==2438== Cachegrind, a cache and branch-prediction profiler 
==2438== Copyright (C) 2002-2012, and GNU GPL'd, by Nicholas Nethercote et al. 
==2438== Using Valgrind-3.8.1 and LibVEX; rerun with -h for copyright info 
==2438== Command: ./test 
==2438== 
--2438-- warning: L3 cache found, using its data for the L2 simulation. 
==2438== 
==2438== I refs:  1,686,675 
==2438== I1 misses:  1,160 
==2438== LLi misses:  1,095 
==2438== I1 miss rate:  0.06% 
==2438== LLi miss rate:  0.06% 
==2438== 
==2438== D refs:  676,987 (458,995 rd + 217,992 wr) 
==2438== D1 misses:  12,616 (11,023 rd + 1,593 wr) 
==2438== LLd misses:  6,338 ( 5,272 rd + 1,066 wr) 
==2438== D1 miss rate:  1.8% ( 2.4%  +  0.7% ) 
==2438== LLd miss rate:  0.9% ( 1.1%  +  0.4% ) 
==2438== 
==2438== LL refs:   13,776 (12,183 rd + 1,593 wr) 
==2438== LL misses:   7,433 ( 6,367 rd + 1,066 wr) 
==2438== LL miss rate:  0.3% ( 0.2%  +  0.4% ) 

注1:Cachegrind 模拟缓存行为,所以它的输出可以不完全准确。特别是,仿真只考虑您正在分析的过程;它忽略了OS/Kernel活动和其他过程。

注2:Cachegrind也可以生成一个大的中介文件。所以如果你的问题是空间需求,Cachegrind可能不是一个好的解决方案。但是,如果您的问题仅仅是输出的格式和可读性,它将会有所帮助,因为cg_annotate会生成易于阅读的输出。

+0

我使用了cachegrind,并且在编译和链接时也使用了-g,但仍然是我感兴趣的函数,其统计信息不存在。即使该函数名称不存在。 – Xara

+0

也许函数被内联。在这种情况下,你仍然可以在函数内部获得注释*。 – jogojapan

0

pinatrace只是一个示例,用于跟踪每个指令与mem操作数。 当调用(例如为) -

// Print a memory read record 
VOID RecordMemRead(VOID * ip, VOID * addr) 
{ 
    fprintf(trace,"%p: R %p\n", ip, addr); 
} 

它被传递的IARG_INST_PTR其是IP(指令指针)所捕获的指令的。如果你知道你的函数所在的虚拟地址范围,你可以在里面添加一个支票,如果你不在这个范围内,就不用打印任何东西。

+0

有没有其他简单的方法来实现这个目标(在我的问题中提到)? – Xara

+0

取决于你在二进制文件中究竟有什么 - 如果你没有调试信息,那么识别这个函数的唯一方法就是使用它的地址 – Leeor