0
我在两台不同的机器上编译的相同CUDA内核的计算时间差异约为3-4倍。两个版本都运行在同一台机器和GPU设备上。解释差异的直接结论是不同的编译器设置。虽然没有一个完美的设置,并且调整应该根据内核来定制,但我不知道是否有明确的指导方针来帮助选择正确的设置。我使用Visual Studio 2010.谢谢。visual studio编译器设置对CUDA内核性能的影响
我在两台不同的机器上编译的相同CUDA内核的计算时间差异约为3-4倍。两个版本都运行在同一台机器和GPU设备上。解释差异的直接结论是不同的编译器设置。虽然没有一个完美的设置,并且调整应该根据内核来定制,但我不知道是否有明确的指导方针来帮助选择正确的设置。我使用Visual Studio 2010.谢谢。visual studio编译器设置对CUDA内核性能的影响
-G
开关通常会对GPU代码性能产生负面影响。
虽然很明显,但我也会说编译器优化很重要('O1','O2 ',...):-) – JackOLantern
我同意,虽然我认为这主要是一个主机编译器标志,而且问题似乎是在询问CUDA内核的性能。在我有限的测试中,我没有看到ptx代码生成从'-O0'到'-O3'的显着差异,尽管我肯定有兴趣证明是错误的。如果我们正在谈论VS代码的主机编译器优化,那么可能还有其他许多优化。 –
谢谢@RobertCrovella,-G旗是一个很好的观点。 – ramino