我目前有一段代码,我试图优化,瓶颈似乎是从一个相当大的矩阵中提取给定的列。高效提取矩阵的列
特别是,我的代码花了50%的时间来执行Wi = W(:,minColIdx)。我也试过线性索引,但没有改变。
我想知道是否有人知道这是为什么,如果有人有任何提示,可以帮助我优化我的代码的这一部分。
谢谢!
编辑:这是我的代码:http://pastebin.com/TnTy6a8D 它现在真的很差优化,我只是在我的新GPU上玩了一下gpuArray。 44行和53行,我试图从W中提取列,是代码瓶颈的地方。
是否有可能共享其他代码呢? – Divakar
这部分几乎不能优化。正如Divakar所说,给我们更多的东西:-) –
@Divakar我将我的代码添加到原始文章。谢谢。 –