是否有性能计数器可用于使用Halide语言编写的代码?我想知道我的代码执行了多少加载,存储和ALU操作。卤化物性能计数器?
用于调度多级流水线的Halide教程通过比较分配内存,加载,存储和调用halide Funcs的数量来比较不同的调度,但我没看到如何收集这些信息。我想,在每次发生这些操作时,可以使用trace_stores,trace_loads和trace_realizations打印到控制台。这不是一个好的选择,因为它会大大减慢程序的执行速度,并且需要某种计数脚本来将控制台输出的长列表编译为所需的加载,存储和ALU操作计数。