2012-11-21 23 views
1

我正在做关于GPU上一些CUDA加速的项目,并完成了一些软件级别的优化计算,并且我发现GPU架构中的一些更改可能会进一步优化项目。GPU架构定制?

现在我的问题是,有没有一种有效的方式或存在的模拟器让我改变GPU架构中的某些功能或部件,然后我可以在该定制架构上对CUDA PTX代码进行基准测试,以获得性能结果(更好循环精确)?有几种CPU架构模拟器,所以我想知道它们中的一些是否可以支持GPU? 或者我可能必须自己编写一个GPU模拟器^ _ ^?

回答

3

您正在准确寻找GPGPU-sim。该模拟器可以准确模拟NVIDIA GPU,并在代码中执行OpenCL和CUDA工作负载而无需修改。我想也可以选择模拟PTX工作负载。从manual

GPGPU-Sim的3.x的运行被由CPU部分 和GPU部分的程序二进制文件。但是,GPGPU-Sim 3.x中的微体系结构(时序)模型报告GPU忙的周期 - 它不是 模型CPU时序或PCI Express时序(即CPU与GPU之间的存储器传输时间 )。

GPGPU-sim可广泛配置,可让您对不同的微架构建模。例如,您可以调整手册中解释的SM,warp调度程序,SIMD组,每个SM的线程数,共享内存大小,寄存器文件大小以及许多其他参数。在仿真结束时,仿真器转储执行持续时间(在GPU时钟周期中)以及许多其他性能计数器。

进一步的信息:

GPU Ocelot是PTX分析器。在以前的版本中,您可以模拟工作负载。但是,最近的版本着重于PTX代码的编译器优化。

MacSimMacSim是另一个复杂而强大的工具,模拟CPU和GPU的异构系统。