IBM X系列服务器企业级架构技术介绍
IBM 企业X型架构 (EXA) 特性和优势:
IBM企业 X型架构展示了一个巧妙构思的演进方法如何创造创新功能。企业X型架构采用三种行业标准服务器技术组件—处理器、内存和I/O—并使用先进的特性来进一步增强,旨在把标准系统提高到一个新的水平。
企业X型架构为业界标准服务器带来了以前仅向大型机和其它高端系统用户提供的功能。这些新功能,结合现有的X型架构技术创造了革命性搣可扩展性经济攠、无与伦比的灵活性和新级别的可用性和性能。通过简化管理、降低成本和提高可用性,使客户感到满意的关键特性包括:
o XpandOnDemand可扩展性、系统分段、 PCI–X I/O子系统、 Active PCI–X
o I/O
o Memory ProteXion
- Chipkill 内存
- 内存镜像
- 热添加/热插拔内存 (即将推出)
o XceL4服务器加速器缓存
在下面的内容中,会按照服务器的扩展性、四级缓存、内存技术、I/O这四个方面的内容做详细的介绍。
企业X型架构: XpandOnDemand
供助于其灵活的模块化设计,企业X型架构为服务器创造了一个革命性新经济模式:客户不再需要预先购买他们可以支付的尽量多的服务器,以确保未来容量增长。您可以边增长边付费。我们称这为创新式XpandOnDemand 可扩展性。
企业X型架构技术使用称为 SMP扩展模块的增强型高性能 4–路 SMP标准构件。使用这些4–路模块作为搣可扩展的企业节点,攠 IBM SMP扩展模块允许从 4–路有效扩展到 8–路再到12–路—甚至32–路系统,通过一个高速SMP扩展端口将它们连接在一起。因此,如果客户最终需要更多的处理功能,可以增加一个备用4–路模块,结合简单布线创建一个 8–路服务器。 如果这一 8–路服务器不能提供足够的插槽和托架,它们可以通过插件式外置远程I/O扩展单元(稍后说明)和远程存储单元,如IBM EXP500,以进一步增加I/O插槽容量 。
企业X型架构 SMP扩展模块包括处理器、内存、I/O支持、缓存、存储和其它设备,可以像其它服务器一样单独运行。 每个模块可以运行一个不同于其它模块的操作系统,或者需要时通过系统分段将多个模块分配给一个操作系统版本。使用系统分段,一个系统可以配置作为一个共享16–处理器的内存系统,或分成多个分段。最终,当支持所有EXA功能时,一个分段就像一个处理器一样小。
模块通过称为SMP扩展端口的专用高速互连设备相互连接,共享资源以实现近乎线性的可扩展性,从而用户能够适应用于运行多个节点作为一个大型搣联合体攠单元,或作为两个或多个小型单元—甚至根据需要稍后重新安排配置。
EXA技术还提供所有处理器和所有内存之间的接入,与它们各自的节点无关,从而减少连接。 借助于每个增加的节点,您还可以增加芯片集、前端总线、PCI总线和其它资源,以共同分担数据流量。更多的节点等于更多的系统带宽。想像一下您在传统的16– 或 32–路 SMP系统中遇到的冲突和资源问题。
同样,通过故障切换支持连接服务器的一个群集就像连接两个、三个或四个4–路节点一样简单。您可以在节点之间使用相同的系统扩展端口布线以进行群集互连。对于可扩展的群集来说, 无需复杂的以太网设置就可创建一个高速互连,因为通过SMP扩展端口它已经存在。此外,以太网 PCI–X插槽对其它 I/O开放。
SMP 扩展模块技术:XceL4服务器加速器缓存
企业X型架构 (EXA) 支持的一种先进特性是一种巨大的第4级(XceL4服务器加速器缓存) 系统缓存,这种特性确保SMP扩展模块内存性能技术的正常运行,在基于Itanium的服务器中每SMP扩展模块为 64 MB 400 MHz DDR (双倍数据传输速率)高速 ECC内存,而在 Xeon系统中为32 MB。
通过在处理器和主内存之间使用高速DDR内存 ,XceL4缓存可以大大提升处理器和 I/O设备的性能。 性能提升多少呢?在厂商自夸比竞争对手超过2%的性能优势的行业中, XceL4缓存可以提高所有服务器吞吐量高达15%到 20%。
Intel 32–位和64–位处理器包含相对小规模(128 K 到 4 MB,取决于处理器)的第1级、第2级和 (使用Itanium) 第3级内置缓存内存。内置缓存的数量受到处理器模块内部可用空间的限制。 高速缓存内存越大,处理器更频繁地查找它需要的数据,同时更少地必需接入速度较慢的主内存。 (处理器速度正在以远快于主内存速度的速率增加;每年缓存搣遗漏攠时必需接入主内存的次数增加。)
大内存容量
Active Memory是企业X型架构中大量内存技术突破,设计用于增加容量、提升性能和可靠性。其中一项技术是支持大内存容量的能力。
虽然某些服务器仍旧受到它们可以安装的内存插槽数量的限制,其它服务器受到服务器正在使用的芯片集可以支持的最大内存的限制。由于这些原因,大多数服务器的内存限制为16 GB RAM或更少。 企业X型架构打破了这一障碍,允许在一个基于64–位 Itanium的服务器中使用多达256 GB 的RAM (在基于 32–位Intel Xeon MP处理器的服务器中为64 GB)。
Memory ProteXion
Memory ProteXion帮助保护不出现由于硬内存错误导致的突发故障。 它的工作方式与Windows NTFS 文件系统中热备用磁盘扇区有些类似,如果操作系统检测到磁盘上有坏扇区,它将把数据写到备用扇区以实现这一目的。Memory ProteXion (在其它系统上也称为冗余位调整)最初开发用于 IBM大型机并且多年来用于 zSeries和 iSeries服务器。
经验显示Memory ProteXion保护的服务器比一台使用标准ECC内存的服务器出现故障的几率要少近200倍。 ECC (错误检测和纠正) DIMM包含 144位, 但只有140位用于数据,剩余的四位未使用。Memory ProteXion仅是将数据重新写到其中一些备用位,而不是迅速禁用DIMM。这种方法允许Memory ProteXion每DIMM纠正四个连续的位错误—每内存控制器八个连续的位错误 (一台服务器可能有多个控制器)。这种先进的技术可以帮助减少服务器宕机,从而形成一个更强大的客户机-服务器计算平台。 这在大型数据库环境中尤其重要,在崩溃的数据库恢复正常运行之前,服务器之间的事务处理/回滚、重新索引和数据同步会导致数小时的丢失。 如果一个内存控制器在备用位外运行,它继续作为第二条防线Chipkill memory。
仅在一台服务器在短时间内遭遇如此多的错误且Memory ProteXion 不能解决的情况下,Chipkill ECC内存 (现在业界标准计算机中为第三代) 才发挥作用。
内存镜像
防止由于内存故障导致的服务器宕机的第三条防线是内存镜像。在该项技术中,内存的管理方法与RAID配置中磁盘镜像非常类似。在这种情况下,主内存条上数据的精确映射被镜像到备用或搣备份攠内存条。结果是,如果一根内存条出现故障,镜像的内存条将变为主内存条。在更换了故障内存条之后,主内存条内存中的数据将镜像复制到新内存条。
PCI–X I/O 系统和Active PCI–X
当前最新的PC I/O总线允许多个64–位66 MHz PCI总线分段,支持每个分段提供 400到 500 MBps。这种带宽不够支持新兴的10 Gbps (GB每秒)—或更高—I/O环境。
如果没有其它的性能提升,PCI将很快成为阻碍这些高速网络以网络最大速度连接服务器的瓶颈。 I/O瓶颈已经阻碍了行业标准服务器成为搣均衡的系统架构攠,这是基于高速 Intel的服务器和大型机系统的一种特性。因此,为了解决这些性能问题,行业开发了一种称为PCI–X的增强型总线,旨在延长 PCI的使用寿命,直到如InfiniBand等下一代串行 I/O架构准备就绪为止。
PCI–X允许所有目前的 32–位和64–位66 MHz PCI 适配器在PCI–X总线中正常运行。 PCI–X适配器充分利用新100 MHz和 133 MHz总线速率, 这允许单个64–位适配器每秒传送多达1 GB的数据。 此外,PCI–X在一条总线中支持两倍于PCI的 66 MHz 64–位适配器。
Active PCI–X 允许您无需关闭服务器就可添加或更换 Active PCI 和Active PCI–X支持的卡。 旨在提升服务器整体可用性的Active PCI–X特性分类如下:
热插拔 允许您更换故障或即将发生故障的适配器,无需重启
热添加 提供简便升级,允许您在服务器运行时添加新适配器(IBM是业界第一家提供这一特性的厂商)
故障切换 在主适配器故障时允许备份适配器负责运行所有正在处理的业务
关于8658-51Y 5100X230 服务器的技术问题:
1.8658 11Y----21Y—61Y-6RY 等 NF 5100/X230 主板全部相同,这种服务器IBM由于
生产设计出了问题,它的CPU 第一个槽位 VRM 报错,严重的会烧CPU和主板。
2,为解决这个问题 IBM后来有一种叫(兰快的叫法)5100改良板 FRU:59P5869
可以不烧CPU VRM 即CPU 第一个槽位 可以正常上CPU ..部分大客户IBM 派篮快
工程师更换过主板 即为 FRU:59P5869 改良板。
3. 还有一个办法:兰快工程师的做法(经过实践)将CPU 上到第二个CPU槽位
加一个VRM 原来第二个CPU槽位的CPU终结板上到CPU 第一个槽位,这样
就回避了烧第一个CPU的损失。即服务器只能上一个CPU .并且CPU只能上到
第二个CPU槽位。这适合于 FRU:09N7844 06P6165 25P3289 即非改良板。
4.这也正是IBM 5100/X230 容易出问题的原因,但也有解决的办法。
所以好的CPU 千万不要上CPU 第一个槽位。
Ipssend命令及配置方法详解
Ipssend是一种在命令行的情况下配置阵列的工具,命令文件本身很小,方便从网上下载,可以解决一些用户丢失server raid, server guide光盘而且又不能从网上下载大约500Mb的光盘iso镜像文件的问题。
主要命令:
1.create--这个命令的功能是在已经存在的阵列或者新的阵列上面创建逻辑驱动器。
说明:这个命令不能创建raid level-x0的逻辑驱动器。
命令格式 : IPSSEND CREATE controller LOGICALDRIVE NEWARRAY/ARRAYID size raidlevel {channel sid}
l controller指的是raid控制器的id号(1-12)
l NEWARRAY指要创建新的阵列(如果不想创建新的阵列这个可以不写)
l size和raidlevel是分别是要创建的逻辑驱动器的大小和阵列的级别
举例:(默认controller为1,硬盘id从0开始,逻辑驱动器大小为100Mb)
1. 一个硬盘做raid 0: ipssend create 1 logicaldrive newarray 100 0 1 0.最后的1 0指的是相应的{channel sid}
2. 二个硬盘做raid 0: ipssend create 1 logicaldrive newarray 100 0 1 0 1 1. 最后的1 0 1 1指的是相应的{channel sid}
3. 二个硬盘做raid 1: ipssend create 1 logicaldrive newarray 100 1 1 0 1 1. 最后的1 0 1 1指的是相应的{channel sid}
4. 三个硬盘做raid 5: ipssend create 1 logicaldrive newarray 100 5 1 0 1 1 1 2. 最后的1 0 1 1 1 2指的是相应的{channel sid} 命令执行之后会把这个newarray定义为array a.
5. 如想在举例4的基础上再创建另一个logicaldrive输入命令:
ipssend create 1 logicaldrive a 100 5 1 0 1 1 1 2.最后的1 0 1 1 1 2指的是相应的{channel sid}
2.delete--这个命令是删除已经存在的array。同时逻辑驱动器上的数据将会丢失。
说明:这个命令不能删除raid level-x0的逻辑驱动器
命令格式 : IPSSEND DELETE controller ARRAY arrayed
l controller指的是raid控制器的id号(1-12)
l arrayID是存在的阵列(A-H)
举例:(假设controller为1,arrayID为a)
ipssend delete 1 array a
3.devinfo--这个命令列出物理驱动器的状态和大小。
命令格式 :IPSSEND DEVINFO controller channel sid
l controller指的是raid控制器的id号(1-12)
l channel 指的是scsi通道(1-4)
l sid指scsi id号(0-15)
举例:ipssend devinfo 1 1 0
显示如下:
Found 1 IBM ServeRAID controller(s).
Device information has been initiated for controller 1...
Device is a Hard disk
Channel : 1
SCSI ID : 0
PFA (Yes/No) : No
State : Ready (RDY)
Size (in MB)/(in sectors): 34715/71096368
Device ID : IBM-ESXSST336732B84G3ET0YAHS
FRU part number : 06P5778
Command completed successfully.
4.drivever--这个命令列出物理驱动器的vendor ID,firmware version和serial number。
命令格式 :IPSSEND DRIVEVER controller channel sid
l controller指的是raid控制器的id号(1-12)
l channel 指的是scsi通道(1-4)
l sid指scsi id号(0-15)
Ipssend drivever 1 1 0
显示如下:
Found 1 IBM ServeRAID controller(s).
SCSI Inquiry DCDB has been initiated for controller 1...
Device Type : Hard disk
Channel : 1
SCSI ID : 0
Vendor : IBM-ESXS
Revision Level : B84G
Serial Number : 3ET0YAHS
Command completed successfully.
5.getconfig--这个命令会列出关于controller,logical drive以及physical的相关信息
命令格式 :IPSSEND GETCONFIG controller AD/LD/PD/AL
controller指的是raid控制器的id号(1-12)
l AD显示控制器信息
l LD 显示逻辑驱动器的信息
l PD显示物理设备的信息
l AL显示以上的所有信息
举例:(默认controller 为 1)
ipssend getconfig 1 al
6.setconfig--这个命令改变控制器的配置,如恢复出场默认值,从硬盘拷贝阵列信息
命令格式 :IPSSEND SETCONFIG controller DEFAULT/IMPORTDRIVE
举例:
把一个控制器恢复成出场设置:
ipssend setconfig 1 default
从硬盘拷贝阵列信息:
ipssend setconfig 1 importdrive
7.scandrives--扫描控制器上的所有硬盘
命令格式 :IPSSEND SCANDRIVES controller
l controller指的是raid控制器的id号(1-12)
用法:(假设controller为1)
ipssend scandrives 1
8.backup--备份阵列信息
命令格式:IPSSEND BACKUP controller filename
l controller指的是raid控制器的id号(1-12)
用法举例:
ipssend backup 1 backupfile
9.restore--还原备份过的阵列信息
命令格式:IPSSEND RESTORE controller filename
l controller指的是raid控制器的id号(1-12)
用法举例:
ipssend restore 1 backupfile
关于ibm的RAID卡降BIOS 的办法
这是IBM升级盘里的一个程序flashman.pro 的文件,要改动下面的程序才可以降RAID 的BIOS ,用IBM RAID的光盘是降不RAID 的BIOS 的.它的办法是首先下载4.84 BIOS 的升级
程序.4.84 BIOS/firmare 的升级盘. flashman.pro 的文件内容如下:
ServeRAID family firmware and BIOS download utility profile
Disk Release: 4.84.01
.
Format =
[------ BIOS -------][---- Firmware -----][------ Boot -------]
:Adapter Name,Image Name,Rev#,Dsk#,Image Name,Rev#,Dsk#,Image Name,Rev#,Dsk#,
.
-----------------------------------------------------------------------------
.
Type:ServeRAID,A:\
.
Unknown Adapter
:?,raid.img,99,1,codeblk.cph,99,2,bootblk.cph,0.00.00,1,
.
Copperhead Adapter
:ServeRAID,raid.img,4.84.01,1,codeblk.cph,2.25.01,2,bootblk.cph,0.00.00,1,
.
ServeRAID on planar image (Navajo)
:ServeRAID1C1,raid.img,4.84.01,1,codeblk.nvj,2.88.13,2,bootblk.nvj,0.00.00,1,
.
Copperhead-Refresh Adapter
:ServeRAID II,raid.img,4.84.01,1,codeblk.rf,2.88.13,2,bootblk.rf,0.00.00,1,
.
Copperhead-Refresh on planer (Kiowa)
:ServeRAID2C2,raid.img,4.84.01,1,codeblk.rf,2.88.13,2,bootblk.rf,0.00.00,1,
.
Clarinet Adapter
:ServeRAID-3H,raid.img,7.84.01,1,codeblk.cln,7.84.01,1,bootblk.cln,0.00.00,1,
.
Clarinet-Lite Adapter (Oboe)
:ServeRAID-3L,raid.img,7.84.01,1,codeblk.cln,7.84.01,1,bootblk.cln,0.00.00,1,
.
Trombone Adapter
:ServeRAID-4H,raid.img,7.84.01,1,codeblk.trb,7.84.01,2,bootblk.trb,0.00.00,1,
.
Morpheus Adapter
:ServeRAID-4M,raid.img,7.84.01,1,codeblk.neo,7.84.01,1,bootblk.mor,0.00.00,1,
.
Morpheus-Lite Adapter
:ServeRAID-4L,raid.img,7.84.01,1,codeblk.neo,7.84.01,1,bootblk.mor,0.00.00,1,
.
Neo Adapter
:ServeRAID-4Mx,raid.img,7.84.01,1,codeblk.neo,7.84.01,1,bootblk.neo,4.84.01,1,
.
Neo-Lite Adapter
:ServeRAID-4Lx,raid.img,7.84.01,1,codeblk.neo,7.84.01,1,bootblk.neo,4.84.01,1,