2011-08-11 40 views
2

另一个带宽相关问题。我预计设备到主机的带宽和主机到设备的带宽是相似的,但我发现这两者之间存在显着差异。考虑到两者遵循相同的路线,所以有效带宽应该是相同的,不是吗?该测试平台由两个插座上的12个Intel Westmere CPU,4个带4个PCIe Gen2 Express插槽的Tesla C2050 GPU组成。使用NVidia代码示例中的bandwidthtest程序。 enter image description hereCUDA:HtoD和DtoH带宽之间的差异

从主机和设备做cudamemCpy的开销是多少?

+0

有趣的问题。对于我的M2050,我似乎得到了类似的结果,而对于我的S1070,结果却相反。结果非常相似 - 你也是 - 非常相似,但是我也想知道差异在哪里。 – Patrick87

回答

2

首先,我会说那两条曲线都是相似。我可以诚实地说,我从未在任何系统上看到对称PCI-e带宽 - 包括CUDA和图形(OpenGL/D3D)测试,所以我不认为这是什么东西(特别是这个小差异)应该关心你。

与您的其他PCI-e带宽问题一样,答案与此类似 - 驱动程序可能会针对不同类型和大小的传输使用不同的策略,试图获得最高吞吐量。

实际吞吐量取决于许多因素,包括GPU的类型,以及使用中的主机芯片组上的,特别是

+0

谢谢你的回答....我总是看到HtoD带宽比DtoH更小。 – Sayan