0
我读到一个带有8个SP的SM,一个warp中的每个线程在执行一条指令期间映射到8个SP中的每一个。因此,在32/8 = 4个时钟周期中执行扭曲。CUDA扭曲发散和时钟周期
如果是这样,那么假设我在代码中有一个if-else语句。假设“then”和“else”分支指令每个需要一个时钟周期才能完成。
如果发散发生,需要多少个时钟周期才能完成if-else语句?它是2还是应该是2 x 4 = 8? (即在后者中,每个四分之一经线2个周期)
欣赏任何澄清!