2011-06-28 62 views
1

我有一个执行有限差分计算的CUDA代码。该代码在Tesla M2090处理器上运行良好,没有错误。相同的代码导致Tesla T10处理器出现大量错误。我的结果中有很多零。NVidia CUDA:Tesla T10处理器和Tesla M2090处理器的区别

不要任何人知道这两个架构和解决方案,如何解决这个问题

回答

5

特斯拉C1060(基于特斯拉T10)之间的差值计算能力的1.3 特斯拉M2090是非常新的架构,基于Fermi( 2.0或2.1) 可能有两个问题:

您是否重新编译了2.0或2.1架构的源代码?如果您为1.3架构编译,它将不适用于> = 2.0。

CUDA编程指南3.1.2二进制兼容性:

二进制兼容性是从一个小版本到下一个 保证 ,而不是从一个次要修订 前一个或各主要 修订。

此外,费米的行为略有不同。一些不安全的代码可能在旧体系结构上正常工作,而在费米它捕捉到这个错误。如果您怀疑这一点,您可以查看“费米兼容性指南”(可以在CUDA工具包中找到),从程序员的角度了解这些架构之间的主要差异。