2014-06-15 122 views

回答

1

不,这是不一样的。

FLOPS是每秒浮点运算。这被用作衡量标准,因为历史上的浮点运算与其他运算相比非常昂贵。

Instructions per cycle将是每个周期执行的任何类型指令的平均值。您需要一个特定的测试用例来衡量,因为每个循环可以执行的指令数量因指令的作用而变化很大。例如,如果执行的第一条指令是一个分支,并且CPU没有正确预测分支,那么这将是该循环中将执行的唯一指令。

this page你可以找到特定的处理器有此测量速度:

2.42 GFLOPS/core 
9.65 GFLOPS/computer 

这是每秒千兆浮点运算。如果你希望每个周期都是FLO,你可以将它与CPU频率相除。

+0

该页面上的触发器编号非常糟糕。有问题的处理器是Sandybridge,其turbo频率为3.3 GHz,因此Rmax /核心频率为3.3 Gbps/s *(2个矢量运算/周期)*(4个双精度触发器/矢量运算)= 26.4 GFLOPS /数字为单精度)。实现的Rpeak会因工作负载而异,但对于经过优化的计算密集型任务,使用两个内核时通常应该超过40 GFLOPS。否则,很好的答案(尽管应该指出,单条指令也可以代表多个触发器)。 –