0
我有一个采访测试,我必须用给定的矩阵乘法算法实现快速矩阵乘法。快速矩阵乘法
我必须在任何需要编译器的平台上实现它。任务说:
•PC实现应该准备好进行SIMD优化。 •为数据处理模块设计合理的接口。 •在不降低效率的情况下编写便携式ANSIC代码。不要使用汇编程序。 •考虑操作的数量和操作的复杂性。关心像函数调用开销,循环开销,内存访问时间和缓存性能的事情
我应该在像raspberry pi这样的平台上实现这个吗?或者在CPU + DSP或ARM + NEON或CPU + GPU模拟器上运行?或者只是给代码?
谢谢
这不是面试官更好的问题吗? –