2012-10-10 63 views

回答

2

非正式地说,如果大部分内核时间花在执行内存指令上,内核就会受内存限制。相反,如果大多数操作是ALU-FPU指令,则内核是计算绑定的。 GPU具有较高的内存和计算带宽,可以适用于这两种类别。这些术语用于分类,并指出哪些优化技术可显着提高应用程序的性能。

对于每个类别的工作负载有不同的优化提示。例如,对于内存绑定的工作负载:利用共享内存,内存访问合并和内存驻留。对于受计算限制的工作负载,减少分支分歧,在ALU-FPU和SFU之间交错计算,并提供足够的独立指令来利用ILP。