CUDA：HtoD和DtoH带宽之间的差异

另一个带宽相关问题。我预计设备到主机的带宽和主机到设备的带宽是相似的，但我发现这两者之间存在显着差异。考虑到两者遵循相同的路线，所以有效带宽应该是相同的，不是吗？该测试平台由两个插座上的12个Intel Westmere CPU，4个带4个PCIe Gen2 Express插槽的Tesla C2050 GPU组成。使用NVidia代码示例中的bandwidthtest程序。 enter image description here CUDA：HtoD和DtoH带宽之间的差异

从主机和设备做cudamemCpy的开销是多少？

来源

2011-08-11 Sayan

有趣的问题。对于我的M2050，我似乎得到了类似的结果，而对于我的S1070，结果却相反。结果非常相似 - 你也是 - 非常相似，但是我也想知道差异在哪里。 – Patrick87

首先，我会说那两条曲线都是相似。我可以诚实地说，我从未在任何系统上看到对称PCI-e带宽 - 包括CUDA和图形（OpenGL/D3D）测试，所以我不认为这是什么东西（特别是这个小差异）应该关心你。

与您的其他PCI-e带宽问题一样，答案与此类似 - 驱动程序可能会针对不同类型和大小的传输使用不同的策略，试图获得最高吞吐量。

实际吞吐量取决于许多因素，包括GPU的类型，以及使用中的主机芯片组上的，特别是。

来源

2011-08-11 23:49:12 harrism

谢谢你的回答....我总是看到HtoD带宽比DtoH更小。 – Sayan