gpu中的平行凸包算法

我正在CUDA中实施凸包的分而治之的方法。这是我的方法：自上而下：gpu中的平行凸包算法

但它变得太复杂了，我觉得我没有利用CUDA的并行功能，因为在树的每一层都创建了N/2^i线程，在合并所有相邻的船体时，复杂度为O（N）。因此，网络复杂性仍然是O（N logN）。

你能告诉我如何让它变得更好吗？或者为凸包提供任何替代的整理器并行算法（如果我可以得到graham扫描的并行版本的算法，那将会很棒）？

2011-07-30 alpha_cod

将你的算法的复杂度仍然是O（N）（相比没有改变一个线程版本），因为你做3两件事：

但是，如果你的点没有排序，你应该更好地并行排序。

2011-07-30 15:17:04

回答