2012-04-05 35 views
4

我正在开发的图形引擎已经开发出了一个主要的瓶颈,即顶点上的矩阵变换(几乎没有静态顶点)。到目前为止,我一直在用CPU转换顶点并每帧更新顶点缓冲区(数据复制本身有点瓶颈,但是到目前为止可管理)。所以我在想,如果我只能在GPU内部保留网格缓冲区,我可以在那里转换顶点,并将转换后的顶点集返回到主内存以进行其他处理(后续处理需要更多的内部连接比GPU着色器允许)。这可能会消除当前代码中的瓶颈。在DirectX中从GPU获取转换的顶点10/11

有关如何做到这一点的任何提示?谢谢。

回答