2010-10-02 32 views

回答

4

为了获得最快的速度,你必须编写使用NEON SIMD操作的ARM汇编语言代码,因为C编译器通常不会编译非常好的SIMD代码,所以手写汇编将会产生很大的差异。我有一个简短的介绍在这里:http://www.shervinemami.co.cc/iphoneAssembly.html

注意的是,iPad的A4采用的ARMv7-A的CPU,因此对于NEON SIMD指令的参考手册在:http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (但其2000页长,需要组装的理解代码,也许一般SIMD!)。

5

指令集NEON,intrinsics reference

我从来没有能够找到什么他们都其实都是很好的文档。但是如果你已经接触到了SSE,你很快就会发现它。

+0

呃,而上证所是...? – dugla 2010-10-03 11:47:05

+1

SSE是针对x86的SIMD,您尝试使用什么代码进行矢量化? – 2010-10-03 15:07:25

+0

这是一个图像处理应用程序。我需要将通常使用LUT完成的窗口级操作转换为SIMD操作。我需要尽可能快地触摸屏幕上的每个像素。使用GPU + GLSL使事情变得复杂。 – dugla 2010-10-04 01:05:32

相关问题