【eNet硅谷动力消息】今天,AMD公司正式发布了代号“伊斯坦布尔”的六核心服务器,这款产品主要面向双路、四路和八路的高端服务器,支持AMD-V虚拟化技术和AMD-P电源管理技术套装,继续采用Socket F 1207平台和低价高能效DDR2内存架构,性能每瓦特相比上代四核心“上海”最多提升34%。在AMD发布新产品的同时,AnandTech发布了相关评测文章,详述了“伊斯坦布尔”的最新技术特性,并对实际性能测试进行了阐述。
1、引言
AMD在第一代65nm四核心“巴塞罗那”推出后,又升级推出了45nm四核心“上海”。“上海”在发布是可谓是当时最出色的服务器处理器,但今年三月底英特尔的Nehalem架构的推出,使得至强5500系列处理器横扫双路领域,在性能上领先对手60%-80%,这是AMD进军服务器市场以来,英特尔取得的最大幅度的领先。
此时,六核伊斯坦布尔就显得更加重要。距离上海发布刚刚半年时间,AMD就增加了两个核心,并升级了集成内存控制器(IMC),使首批频率达到了2.6GHz,更令人注意的是,伊斯坦布尔的功耗仅仅比2.7GHz的上海高出几瓦。

六核心伊斯坦布尔的Opteron 8435 2.6GHz
2、六核心之优劣
当年,英特尔发布六核心的“Dunnington”的时候就很少有应用程序能充分发挥这些核心的潜能,而伊斯坦布尔也将面临同样的问题。
有些服务器程序习惯于利用2n个核心,很少一部分能扩展到八核心,至于能用满十六核心的更是非常罕见。的确,不仅仅在桌面上,服务器中同样有很多程序的多核心扩展性非常有限,比如邮件服务器、网络服务器等,渲染程序也会在核心数超过八个时性能急剧下滑。
当然,六核心也有它的好处。Nehalem Xeon有四个物理核心、八个逻辑核心,但是每两个线程就需要共享32KB一级缓存和256KB二级缓存,而伊斯坦布尔的每个核心都能独享64KB一级缓存和512KB二级缓存。显然,伊斯坦布尔瞄准的是计算敏感的HPC、大规模数据库,尤其是高负载的虚拟化应用这些方面。
另外,伊斯坦布尔和上海的内存支持能力其实相差不大,所以使用新系统的时候首先可能会遇到内存资源紧张的问题,然后才会是计算能力不足。

六核心伊斯坦布尔核心照3、伊斯坦布尔的技术改进
与上海相比,伊斯坦布尔除了增加两个内核之外,其变化并不大,主要涉及以下四个方面:
探测过滤器技术“HT Assist”:
之前曾多次介绍过这种探测过滤器技术,通过下边的对比就会更明白了。

上图是四核心上海简图。CPU 3需要CPU 1才有权访问缓存行(cacheline),但实际上最新的数据是在CPU 2的二级缓存里,流程如下:
1)CPU3向CPU1请求数据(蓝色实心箭头)
2)CPU1发出广播,询问其它CPU核心,看谁有所需数据且s距离最近(三个红色实心箭头)
3)CPU3等待问题解决(四个红色空心箭头)
4)请求数据从CPU2传输给CPU3(两个蓝色空心箭头)
这种广播式处理方式有两个严重缺点:一是简单的请求需要十次处理,浪费大量带宽;二是这十次处理给CPU3的指令增加了大量的延迟。
上述问题的解决方案就是基于目录的探测式系统,AMD称其为“HT Assist”。HT Assist是在每颗处理器上保留1MB三级缓存作为一个目录,用于跟踪系统其它地方使用的缓存行。这样,即使三级缓存只剩下了5MB,却省去了大量的探测传输。

上图就是新的六核心伊斯坦布尔简图。同样是之前的问题,现在的流程是:
1)CPU3向CPU1请求数据(蓝色实心箭头)
2)CPU1检查三级缓存目录来定位所需数据(鲜红色粗箭头)
3)直接向相关数据最近的CPU2发送请求(深红色实心箭头)
4)请求数据从CPU2发送到CPU3(两个蓝色空心箭头)
这样,处理次数从十次减少到了五次,可大大降低延迟、节省带宽。对四路系统而言,内存带宽能够多出60%:没有HT Assist时是25.5GB/s,有了HT Assist就可以达到41.5GB/s。

特别指出,HT Assist只对四路、八路系统有用,特别是后者,但对双路系统就完全没用了。双路系统只有两颗处理器,加上HT Assist还会占用三级缓存,所以在双路系统中应该禁用它,在BIOS里显示为“Probe Filter”。

X8 ECC:
内存条上的每一颗内存芯片都提供4-bit或8-bit位宽,分别表示为x4和x8,这样组成64-bit位宽就需要16颗x4芯片或8颗x8芯片,因此内存条上至少要有八颗芯片(单面或双面)。现在,伊斯坦布尔的内存控制器已经支持x4和x8两种类型内存条的错误校验(ECC)了。
远程电源管理界面“APML”:
对于大规模数据中心而言,每台服务器都进入BIOS来调整电源管理参数是很麻烦的,APML就是个非常方便的解决办法。它有一个通过P-State电源状态限制来监视、控制平台功耗的界面,从而无需进入BIOS调整。
但是,服务器系统需要一颗处理器和BMC(管理处理器)来支持APML,在软件方面也有一定的要求。而现在软硬件都还在研发中,所以伊斯坦布尔发布之初此功能暂不可用。
更快的HT总线速度:
“上海”的HT 3.0总线最高速度为2.2GHz DDR,方向带宽8.8GB/s,而伊斯坦布尔则提高到了2.4GHz DDR,即9.6GB/s,与Nehalem Xeon低端版本的QPI总线带宽相同。不过,该功能要等到AMD的Fiorano平台完成后才能完全实现,现在搭配NVIDIA MCP55平台还是限制在2.2GHz DDR。 4、首发产品线
首批伊斯坦布尔有五款型号,均为75W标准型,而105W SE高性能版、55W节能版、40W超低功耗版将在第三季度推出。
面向双路应用的有Opteron 2435/2431/2427三款,其主频分别为2.6/2.4/2.2GHz,二级缓存6×512KB,三级缓存6MB,单向互连带宽9.8GB/s或8.8GB/s。这三款新品价格分别为989美元、698美元和455美元。


面向八路应用的有Opteron 8435/8431两款,其主频分别为2.6/2.4GHz,售价为2649美元和2149美元。

再来看AMD和英特尔最近几代服务器处理器的生产工艺、晶体管数量、核心面积和核心数量。伊斯坦布尔集成度与上海相近,晶体管数量不到Dunnington的一半、核心面积则接近七成。

服务器应用和性能指标对普通桌面用户来说太遥远了,就不再详述了,数据和柱状图可以说明一切,相信大家通过这些很容易就能看清上海、伊斯坦布尔、Nehalem Xeon等等之间的性能差异。














这部分的测试只完成了一小部分,还需重新检查,因此这里只简单说明一下:满载状态下 Opteron 2435系统比Xeon X5570系统省电大约为35-45W,这一差距在略高于 300W的系统上非常明显;而待机系统功耗,现在看来Nehalem Xeon好像略占优势。
6、总结
就单路和双路的应用而言,伊斯坦布尔相比同频的上海在OLTP、ERP、Reporting、OLAP、HPC、虚拟化等方面带来的性能提升少则5%、多则27-46%,可惜的是Web方面会下滑3%。Xeon X5570 2.93GHz与Opteron 2435 2.6GHz相比,其优势非常明显,除虚拟化应用基本相似之外,OLTP、ERP、Reporting、OLAP、Web、HPC均能高出 14-50%。
显然,伊斯坦布尔无法取代Nehalem Xeon 5500系列,后者拥有超线程技术和更高的频率、IPC以及内存带宽,在OLTP、ERP、网络服务、渲染、高性能计算(HPC)等领域仍然是首选。
不过,伊斯坦布尔并非毫无用武之地。综合考虑其性能、功耗和成本,至少在支持数据库和虚拟化两个领域伊斯坦布尔是非常合适的。
最后,AnandTech透露,伊斯坦布尔在四路领域是个非常可怕的竞争对手,但详细评测稍后才能完成。(编译/月儿)