当人们都以为摩尔这位超级BOSS的咒语(摩尔定律)即将失效时,英特尔的“Tick-Tock”(工艺年-架构年)钟摆再一次摆动了,这一次摆到了“Tock”一边,也就是说英特尔会推出基于新架构的处理器。它来得那么突然,你做好准备了吗?
就算没有新工艺或新架构诞生,新的处理器也时时推出,不是提高频率、增加缓存,就是增加核心数。只不过现在处理器的性能已经超前于操作系统及应用程序,而且处理器在游戏中的贡献越来越少,以至于人们对它的关注度变小了。英特尔这次推出的新一代处理器名曰酷睿i7,这名字使人想起了松下“爱妻号”洗衣机,于是这个谐音的昵称就这么传开了。根据英特尔的技术白皮书中所说,酷睿i7在游戏性能方面做了很多修改,下面就让我们一探究竟吧。
何为真假四核?
我们知道,酷睿2是第一代采用酷睿微架构的处理器,它的核心代号为Conroe(后来的Wolfdale、Yorkfield在架构上并没有本质变化),如今的酷睿i7是第二代产品,虽然架构名称仍然是酷睿微架构,但已经是完全不同的新一代产品了,核心代号也变为Nehalem。酷睿2时代的四核处理器实际上是由两个双核心封装在一起得到的,这样可以缩短研发周期,以最快速度投产,抢夺市场先机。也正因为如此,AMD与英特尔之间爆发了“真假”四核的口水战。其实问题不在于这4个核究竟是拼起来的还是原生的,而在于核心间协同工作的管道是怎样的。从这个角度讲,AMD的四核技术的确要先进一些,简单说就是每个核心可以直接通信,而酷睿2则要绕一大圈通过北桥芯片“传话”。不过理论归理论,由于AMD与英特尔处理器的缓存(速度和容量)、频率等都不一样,所以很难客观地比较出二者的性能差距,因此这样的口水仗往往是没有结果的。如果在同价位上进行比较的话,它们也是各有胜负,所以我们不想再就此问题做过多讨论,可以一言以蔽之:没有最好的架构,只有最好的产品。
显然,英特尔有自己的策略,“拼凑法”只是为他们争取更多的时间来研发更好的“真四核”产品,换句话说就是用相对低的成本保住大部分市场份额直至真正有竞争力的产品出现带动又一次市场成长。现在酷睿 i7就采用了原生的四核设计,并通过QPI总线联系各个核心,而QPI总线的传输速率是上一代产品通过北桥通信的前端总线的5倍。从表1中不难看出酷睿i7在频率上并不比以往产品高,这也正是近两年处理器发展的趋势——通过改进架构、增加核心数及缓存改善性能,通过改进制造工艺降低功耗及发热量。
英特尔酷睿2/酷睿i7规格对比:
处理器型号
酷睿2 E8400
酷睿2 QX9770至尊版
酷睿i7-920
酷睿i7-940
酷睿i7-965 至尊版
核心代号
Wolfdale
Yorkfield
Nehalem
Nehalem
Nehalem
核心数量
2
4
4
4
4
核心频率
3.00GHz
3.2GHz
2.66GHz
2.93GHz
3.20GHz
接口类型
LGA 775
LGA 775
LGA 1366
LGA 1366
LGA 1366
接口尺寸
37.5×37.5×4.11
37.5×37.5×4.11
45×42.5×4.55
45×42.5×45.5
45×42.5×45.5
晶体管数量
4.1亿
8.2亿
7.31亿
7.31亿
7.31亿
核心工艺
45nm 高-K
45nm 高-K
45nm 高-K
45nm 高-K
45nm 高-K
核心尺寸
107mm2
214mm2
265mm2
265mm2
265mm2
总线带宽
10.6GB/sec
12.8GB/sec
25.6GB/sec
25.6GB/sec
25.6GB/sec
二级缓存
6MB
6MB×2
256KB×4
256KB×4
256KB×4
三级缓存
-
-
8MB
8MB
8MB
TDP功耗
65W
136W
130W
130W
130W
参考价格(美元)
184
740
284
562
999新架构好在哪里?
既然说是全新架构,肯定不只是原生四核这么简单。的确,酷睿i7在很多方面进行了改进,下面让我们一项一项看清楚。
内存控制器与三通道技术
大家对内存控制器(Memory Controller)应该不会感到陌生吧?英特尔最大的竞争对手AMD早在2003年,K8时代,就将内存控制器集成在了处理器中,大幅提升内存性能。以前总是说AMD处理器,游戏性能如何如何好,其实很大程度上,就是集成了内存控制器的原因,因为这种设计使得处理器可以直接与内存进行数据交换,不必再通过北桥芯片兜一个圈子通控制了。很多3D游戏都需要加载大量数据到内存中,比如NPC行为特征、AI等,因此提高内存访问效率可有效提升游戏性能。
不过受限于内存运行频率,在处理器中集成控制器所能达到的效果并没有质的飞跃,因此虽然技术先进,但是英特尔却没有马上跟进,一直用北桥芯片“对付事”。如今DDR3已经推向市场,内存频率得到进一步提升,同时英特尔又新研发了3通道技术,内存性能不再是其与处理器通信的瓶颈,因此英特尔也适时地在酷睿i7中放入了内存控制器IMC(Integrated Memory Controller),当使用DDR3-1333(支持XMP技术的内存可运行在1600MHz频率下)内存时,内存位宽从128位提升到192位,使得峰值带宽可达32GB/s,是酷睿2平台内存性能的2~4倍。
这样一来,内存性能提升对游戏的帮助就更加明显了,在处理器频率和显卡性能不变的前提下,内存的游戏性能可提升10%以上。
全新的QPI总线
目前主流的英特尔系统都采用前端总线技术(FSB,Front Side Bus),这项总线技术已经延用了很多年了,一直在改进,虽不至于影响处理器的性能,但已经制约了处理器的进一步发展。为了解决这个问题,英特尔首次在酷睿 i7处理器上,抛弃了前端总线,转而使用最新的Quick Path Interconnect(QPI)总线技术。
从我们得到数据可知,以往前端总线最高可实现1.6GT/s(1600MHz)的数据吞吐量,折算为传输带宽是12.8GB/s(换算公式:前端总线带宽=系统外频×N倍速×64位总线位宽/8),而QPI总线则可以实现6.4GT/s的数据吞吐量,由于单向位宽为16位,所以QPI的传输带宽为25.6GB/s,是前端总线的两倍。除了性能提高外,处理器等待的时钟周期也缩短了,对性能也是有帮助的。
就拿游戏《Football Manager 2009》(《足球经理2009》)来说,该游戏的3D界面十分简单,对显卡的要求较低,能否流畅运行主要考验处理器的运算能力,对于这类游戏,酷睿i7的帮助会很大。对于运行大型数据库的电脑来说,QPI总线的帮助也很大,无论是建档还是运行,都有至少40%的性能提升,而且这项提升还仅仅是QPI一项改进所达到的效果。更精准的分支预测
酷睿i7除了在总线结构有全新的变化外,在处理器微架构方面也有非常多的改进,其中包括全新的Lock支持、追加的缓存等级、更深的Buffers、改良的Loop Streaming、Simultaneous Multi-Threading超线程技术、SSE4.2指令集、更好的分支预测、更快的虚拟技术。
其中分支预测的改进,对于比较依赖处理器性能的游戏来说好处也是非常明显的,因为分支预测性能的好坏会直接影响处理器计算效率的高低,如果在处理数据过程中能预测命中,处理器则会快速地继续执行工作,无需花费额外的时间去处理这个过程,而酷睿i7不仅允许更大容量的预取,而且增加了一个新的预取单元。以还没正式发布的游戏《暗黑破坏神3》来说,其支持处理器模拟软性物理运算,所以游戏中的每一次移动或者是挥刀施法的动作都会产生大量的运算,这个时候处理器不用总重复读取数据,效率会高很多。
超线程技术的回归
超线程技术(Hyper-Threading),最早出现在130nm工艺制造的奔腾4处理器上,其本质就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理核心,使得单核处理器也能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了处理器的闲置时间,提高的处理器的运行效率。后来超线程技术也曾应用在双核的Pentium D处理器上。现在,通过改进的超线程技术又回归到了酷睿i7处理器上,而且,这一次,名称也换作了同步多线程技术(Simultaneous Multi-Threading,SMT)。
由于增加更多层级的缓存及拥有更大的内存带宽,酷睿i7处理器中的SMT技术比之前用在奔腾4处理器上的超线程技术对性能的提升更多。
以游戏《使命召唤5》为例,该游戏支持多核心处理器和物理运算,在没有安装物理加速卡的情况下,使用酷睿i7处理器,游戏会将其识别为7核心处理器和一个物理加速处理器,由此可见酷睿i7并不是简单地模拟多核心。
更多层级的缓存
处理器缓存的层级数对处理器的运算性能影响巨大,这种影响特别体现在玩游戏和执行大型软件时。以往酷睿2双核处理器是两颗核心间共享二级缓存,而四核产品则是以每两核心为一单位共享二级缓存;酷睿i7处理器则采用了每颗核心独享二级缓存,四颗核心共享三级缓存的策略。酷睿i7的每个核心拥有256KB的二级缓存,四颗核心共享8MB三级缓存,而一级缓存则和前代产品一样,32KB指令缓存和32KB数据缓存。
除了增加大容量的三级缓存以外,酷睿i7微架构还增加了两个额外的缓冲器,低延迟第二级512路Translation Look-aside Buffer(TLB)和第二个Branch Target Buffer(BTB),通过它们可以进一步提升数据处理性能。根据英特尔的官方评测数据来看,在大型3D游戏中,大容量的三级缓存起码对3D性能有7%的性能提升。
SSE4.2指令集
英特尔新版的SSE4指令集包含了54条新指令,其中47条指令在上一代45nm Penryn处理器上已实现,被称作SSE 4.1,而剩下的7条SSE4指令是在酷睿 i7处理器上新加入的,新版本被称作SSE4.2。新增加的指令集可以有效提升3D运算,XML,sring和文本处理性能。智能的Turbo Mode
这个技术是基于酷睿i7处理器的“Integrated Power Gate”电源管理技术。酷睿i7处理器内部通过分析当前处理器的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率上,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响处理器的热设计功耗的情况下,能把核心工作频率调得更高。
举个简单的例子,如果游戏只用到一个核心,Turbo Mode就会把其他三个核心自动关闭,把正在运行游戏的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。酷睿2时代,即使是运行只支持单核的程序,其他核心仍会全速运行,得不到性能提升的同时,也造成了能源的浪费。
更加环保节能
首先,酷睿i7处理器引入单独的功耗控制单元,它提供了对处理器核心以及其他内部电路的实时监控,包括核心温度、温度、电流、功耗等。而单独的功耗控制单元是酷睿i7处理器功耗管理的第一步,酷睿i7处理器还吸纳了众多的节能技术,其中包括上一代笔记本电脑平台45nm处理器的节能技术。
酷睿i7处理器还包括了Package C3节能技术,这个技术使得酷睿i7处理器核心进入C3和C6节能状态后,整个处理器都会进入不工作状态,这个状态的改变都是硬件自身实现的,无需操作系统和软件支持,而此前处理器核心则只能靠单纯进入节能状态,来减少功耗。
英特尔酷睿i7处理器性能全面解析" border="1" / i7真的是游戏大拿?看了这么多关于酷睿i7的技术改进,别看花了眼,说的天花乱坠不管用,还是用实际测试看看它的性能究竟如何吧(测试以大家关心的游戏性能为主)。
测试平台
处理器
英特尔酷睿i7-920
处理器散热器
Tt V1加强版散热器
内存
金士顿1GB×3 DDR3-1066
主板
英特尔X58主板(X58+ICH9R)
显示卡
讯景GeForce GTX 280(核心/显存频率:605MHz/2200MHz)
硬盘
英特尔固态硬盘80GB
电源
Tt Toughpower 1200W(ATX12V 2.2/1200W)
显示器
三星SyncMaster 245B
操作系统
Microsoft Windows Vista SP1(32bit)
主板芯片组驱动
Intel Chipset Software Installation Utility(V9.10.1011)
显卡驱动
nVIDIA ForceWare 178.24 WHQL
桌面环境
1920×1200_32bit@60Hz
测试结果
测试项目\测试程序
1280×1024
1680×1050
3DMark06 Build 1.0.2
10421
10141
3DMark Vantage
17255
17028
失落的星球
88.5
49.6
冲突世界
89
70
极品飞车:极道车神
101.5
97.5
测试项目:基准测试项目为3DMark06 Build 1.0.2和3DMark Vantage,测试游戏项目为《失落的星球》、《冲突世界》和《极品飞车:极道车神》。测试过程中,我们都采用测试程序或游戏的默认设置,只改变解析度。
从测试结果来看,酷睿i7的性能表现还是相当令人满意的,但是若说选购产品,就不能脱离价格空谈。经过比较,我们发现酷睿i7-920是一款性价比较高的产品,它性能直逼酷睿2 QX9770至尊版,价格却只有不到后者的40%,如此高的性价比很值得高端玩家关注。当然,与酷睿2 QX9770至尊版相比,酷睿i7-940同样是高性价比产品,但问题是,它与酷睿i7-920之间的差距并没有想象中那么大,价格差了一倍不说,如果酷睿i7-920经过超频的话,性能同样可以媲美酷睿i7-940。因此,在目前的酷睿i7家族中,仅有酷睿i7-920是值得选择的产品。而且就算是这个“值得”也很牵强,有多少人会购买2000元的处理器?恐怕酷睿i7目前意义主要是“精神发烧”吧?不过这也不希奇,每一代新产品都是从高端开始发布,它们对于主流用户的主要意义不在于“是否应该购买”,而是在于考察“该系列产品会不会有前途”以及“上一代产品会不会马上降价”。基于我们的判断,这一代四核产品是值得期待的,但换代过程不会太快。初步预计,基于Nehalem核心的酷睿i7产品将在明年第四季度进入主流价位。