FLOPS,是“每秒所执行的浮点运算次数”(floating-point operations per second) 的缩写。
它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。
正因为 FLOPS 字尾的那个 S,代表秒,而不是复数,所以不能省略掉。
在这里所谓的“浮点运算”,实际上含括了所有渉及小数的运算。
这类运算在某类应用软件中常常出现,而它们也较整数运算花时间。
现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点单元”(FPU)。也因此 FLOPS 所量测的,实际上就是 FPU 的执行速度。而最常用来测量 FLOPS 的基准程序 (benchmark) 之一,就是 Linpack。
1GHz 就是每秒 十亿次 运算,如果每次运算能完成两个浮点操作,就叫 2G FLOPS(每秒二十亿次浮点操作)。现在家用的双核计算机通常都能达到每秒 五十亿次运算(2*2.5GHz)左右的水平,浮点性能大约是上百亿次浮点操作。 超级计算机发展得很快,目前划分超级计算机的门槛是“每秒一万亿次浮点操作”,是家用微机的一百倍以上,几年以后这个门槛预计会提高到十万亿次。 超级计算机几十、上百万亿次的 FLOPS 也是靠多个处理器(通常还是多核)堆起来的,比如的IBM Roadrunner (走鹃,一种喜欢在地上飞快地走的小鸟)有 6562 个 AMD Opteron 双核处理器,12240 个 PowerX Cell 8i 处理器, 其中主要的浮点运算能力是由 Cell 处理器提供的, 每个 Cell CPU 包括 8 个浮点处理核心,你可以理解为 8 核。 (Cell也是 Sony PS3 游戏机的处理器,不过用于PS3的比用于超级计算机的要次一等) 总体来看,就是 2 * 6562 = 13124 个通用处理器核心; 8 * 12240 = 97920 个专用处理器核心。 你说这么多钱堆出来的这么十多万个核心,速度能不快吗? 它的速度是 1.026 P FLOPS,1P=1024T=1024*1024G , 也就是每秒超过 一千万亿次 浮点操作
截止至 2009.11.21 当今最强的 GPU 排名如下
顺序----GPU/CPU----FLOPS
1----ATI 5970----4.64(T)
2----ATI 5870----2.72(T)
3----ATI 4870x2----1.2 x 2(T)
4----ATI 5850----2.09(T)
5----GTX 295----0.894 x 2(T)
6----ATI 5770/4890----1.36(T)
7----ATI 4870----1.2(T)
8----GTX 285----1.06(T)
9----ATI 5750----1.008(T)
10----ATI 4850----1(T)
11----ATI 4770----0.96(T)
...
N----ATI 4830----0.736(T)
...
N----Core i7 965----0.00756(T)