我想使用ARM汇编指令和ASIMD指令并行地在汇编指令中实现代码。我的第一个问题是,这是否可以在ARMv8上完成?根据this线程,它可能在ARMv7上,但NEON和ARM寄存器之间的数据传输需要相当长的时间。其次,我正在寻找一种可以并行实现我的汇编代码的方法。这是我想要做的:AArch64 - 并行运行ARM和ASIMD指令
.
.
.
<ASIMD instruction>
<ASIMD instruction>
<ASIMD instruction>
<Data MOV between ASIMD vectors and ARM Reg>
<ARM assembly instruction> ------- <ASIMD instruction>
<ARM assembly instruction> ------- <ASIMD instruction>
<ARM assembly instruction> ------- <ASIMD instruction>
<Data MOV between ARM Reg and ASIMD vectors>
<ARM assembly instruction> ------- <ASIMD instruction>
<ARM assembly instruction> ------- <ASIMD instruction>
<ARM assembly instruction> ------- <ASIMD instruction>
.
.
.
我想知道如果我可以做到这一点使用两个线程。我正在研究ARM-CortexA53微处理器。我也可以访问ARM-CortexA57,但我认为这些平台大致相同,并且具有相同的功能。
Cortex-A53是一个大部分双重问题的有序设计; Cortex-A57通过3宽解码/调度阶段进行乱序执行;他们只是“大致相同”。 – Notlikethat
@Notlikethat感谢您的澄清。我已经做了一些研究,现在我明白A57和A53有完全不同的架构 – A23149577