为了安装一台即将到货的SUN 4800和T3,我仔细看了一下SUN FIRE 6800/4810/4800/3800 System Manager Manual,并做了笔记,为了便于和原文对照,笔记严格按照原文的体系结构。对一些不必要的废话,都省略,力求精炼。
这一章概括地介绍了SUN 6800、4800、4810、3800的一些概念。目的是让你对这些系统特征有个基础的了解。不提供系统的设置,对系统的设置操作在第三章介绍。
这一章描述了:
分区(Partitions)
域(Domains )
系统控制器(System Controller )
冗余组件和最小配置(Redundant Components and Minimum Configurations)
可靠性、有效性和适用性(RAS)
SUN 的管理中心软件(针对SUN 6800、4810、4800、3800)
FrameManager(这个词不知道怎么翻译合适)
概括介绍
对于涉及的所有被管理的共享资源, 系统控制软件提供了一个中心控制的入口,使用术语platform 来标识。例如系统控制器 setupplatform 命令用来配置平台,具体怎么使用在后面介绍。
一个分区是一组转发板(a group of repeater boards),每个分区最大扩展到两个域。因为域在同一个分区里共享转发板,所以这个域不是完全隔离的。配置分区的数量的命令使用setupplatform来完成。你可以逻辑上划分一组系统板(CPU/内存板、I/O集)到一个域。一个域可以运行一个SOLARIS操作环境,不受其他域的影响。
系统控制器是板上内含的一个系统,连接到中央系统,它为域和平台的配置管理提供了一个指针,并且提供了到DOMAIN CONSOLES的一个入口。这个系统控制器由硬件和软件组成。这个系统控制器的命令让你可以配置平台、每个域,还有很多其他功能。
分区介绍:
你可以使用setupplatform命令来配置分区的数量,如果值被设置为SINGLE,这个系统被设置为一个分区,使用所有的转发板。如果被设置为DUAL,系统被设置为两个分区,在双分区模式下,两个小分区被建立,每个分区使用系统总转发板数量的一半。在6800上,在双分区模式下,每个分区可以设置有2个转发板。在4800、4810、3800上,在双分区模式下,每个分区可以有1个转发板,在单分区模式下,每个分区拥有所有的转发板。
分区和域如下所示:
6800 4810/4800/3800
分区数量: 2 2
在双分区模式激活的域 4 (ABCD) 2 (A、C)
在单分区模式下激活的域 2 (A、B) 2 (A、B)
域介绍
域包含下列特征:
每个域都能够运行SOLARIS操作系统环境
域之间彼此不会受到影响
每个域有它自己的外围设备和网络连接
每个域有它自己的唯一的主机ID和SOLARIS操作环境主机名
所有的系统在工厂都被默认配置为一个域(DOMAIN A)
一个域能够做到:
运行SOLARIS系统
进入 OPENBOOT PROM
进行POST 自检
要建立域,你既可以使用系统控制器的命令,也可以使用SUN 管理中心软件(FOR 6880/4800/4810/3800),一个大的域由系统的所有CPU/内存板、I/O集组成。一个小的域由一块CPU/内存板、I/O集组成。
一个激活的域(有开关可设置为ON,DIAG,SECURE)必须具备:
最少一块CPU/内存板
最少一个带有I/O卡的I/O集
最少一块转发板
充足的供电电源(不分配到单个域)
充足的冷切系统(不分配到单个域)
系统控制器(不分配到单个域)
今天先看到这
系统控制器介绍
系统控制器功能包括;
管理平台和域资源
监控平台和域资源
配置域
提供域CONSOLES
提供虚拟时间TOD(TIME OF DATE)到域
提供日期和时间到SOLARIS操作环境
提供时钟信号为所有使用的板
提供CONSOLES安全
执行域初始化
提供命令来升级firmware
执行环境监控
系统支持扩展到两块系统控制板,第二块控制板在主控制板时钟失效后使用。
串口和以太网端口介绍
在系统控制器上有两个端口:
串口(RS-232):使用串口(RS-232)来直接连接ASCII终端或网络终端
以太网端口:用来连接网络
TTYa 和TTYb 连接介绍
6800有一个内建的电缆从系统控制器连接到串行端口,使用TTYa连接到CONSOLE ,使用TTYb连接到framemanager。4810/4800/3800使用Y电缆提供TTYa和TTYb的连接。
到每个域和平台的连接
系统控制器允许到多个平台的连接(最大16个),但是到每个域的连接只允许有一个。
板状态
CPU/内存板和I/O集有四种不同的状态,所有的板都会处于其中的一种状态。
状态一:可用 板子未被分配到任何域,域通过适当的方式能够看到板子
状态二:被分配 扳子被分配给一个域,但还未激活,因为扳子没有被配置好。
状态三:活动的 板子被一个活动的域使用,一个活动的板子不能再分配,直到域被关闭为止
状态四:未应用 没有应用
使用showboards命令可显示板子的状态。你在platform shell下输入showboards –V ,可列出平台上所有的设备,在DOMAIN shell下 使用这个命令可显示出在域中所有的设备。
例如:在platform shell下
schostname:SC> showboards
Slot Pwr Component Type State Status Domain
---- --- -------------- ----- ------ ------
/N0/SB0 On CPU Board Active Passed A
/N0/SB2 On CPU Board Active Passed C
/N0/SB4 On CPU Board Active Passed D
/N0/IB6 On PCI I/O Board Active Passed A
/N0/IB7 On PCI I/O Board Active Passed C
/N0/IB8 On PCI I/O Board Active Passed D
schostname:SC> showboards -v
Slot Grd Pwr Component Type State Status Domain
---- --- --- --------------- ----- ------ ------
SSC0 - On System Controller - Passed -
SSC1 - On System Controller - - -
ID0 - On Sun Fire 6800 Centerplane- - -
PS0 0 On A152 Power Supply - OK -
PS1 0 On A152 Power Supply - OK -
PS2 0 On A152 Power Supply - OK -
PS3 1 On A152 Power Supply - OK -
PS4 1 On A152 Power Supply - OK -
PS5 1 On A152 Power Supply - OK -
FT0 0,1 On Fan Tray Low Speed OK -
FT1 0,1 On Fan Tray Low Speed OK -
FT2 0,1 On Fan Tray Low Speed OK -
FT3 0,1 On Fan Tray Low Speed OK -
RP0 0 On Repeater Board - OK -
RP1 0 On Repeater Board - OK -
RP2 1 On Repeater Board - OK -
RP3 1 On Repeater Board - OK -
/N0/SB0 0 On CPU Board Active Passed A
/N0/SB1 1 On CPU Board Active Passed A
/N0/SB2 0 On CPU Board Active Passed A
/N0/SB3 1 On CPU Board Active Passed B
/N0/SB4 0 On CPU Board Active Passed C
/N0/SB5 1 On CPU Board Active Passed D
/N0/IB6 0 On PCI I/O Board Active Passed A
/N0/IB7 1 On PCI I/O Board Active Passed B
/N0/IB8 0 On PCI I/O Board Active Passed C
/N0/IB9 1 On PCI I/O Board Active Passed D
平台管理介绍
平台管理管理配置平台和系统的硬件组件,这个平台管理能够越过域管理硬件资源,包括:
配置平台(NETWORK、LOGS、SNMP)
设置系统控制口令
监控和控制平台内的电源
配置系统能够支持的最大数量的域
通过系统控制命令逻辑地划分硬件组到建立的域,如使用addboard and deleteboard,在 domain
shell下也可执行
对域对CPU/内存板、I/O集的控制使用进行配置
Platform Shell
platform shell是一种平台管理的操作环境,在这个shell下管理任务能够被执行,它不提供CONSOLE的信息
platform shell下的提示符是 schostname:SC>.
Platform Console
platform console通过串口进行连接,它提供了错误和一些信息消息。它不显示SOLARIS环境的CONSOLE消息,要看SOLARIS环境的CONSOLE消息只有到DOMAIN CONSOLE 下,它的提示符和
platform shell相同。
系统控制任务通过System Power-On执行
当你打开系统电源时,系统控制引导,并且开始系统控制的应用。包括:
打开各组件,例如(CPU/内存板、I/O集、风扇、转发板、电源)
恢复建立的域并激活
域管理介绍
系统控制器允许域管理执行以下任务:
通过逻辑划分系统板建立域,每个域有自己的SOLARIS操作系统,不受其他域的影响
对域进行设置
引导域
附加地,系统控制软件可以执行以下任务
对环境问题进行报警,例如温度过高
当发生紧急情况时自动关闭,例如当一个域的CPU温度过高时系统控制器软件自动关闭那个域。系统控制器会监控和显示所有的部件的温度和电压
依赖于你的设置,如果设置打开,当SOLARIS 内部发生问题。系统控制器会重新启动一个域。
Domain Shell
domain shell是一种域管理的操作环境,在这个shell下域任务能够被执行,有四种domain shell(A-D)
domain shell下的提示符是 schostname:domainID>.
Domain Console
当域是活动的(SOLARIS在运行、PROM或POST在运行),你能访问到Domain Console,当你连接到Domain Console时,将会出现下面中的一种操作模式:
SOLARIS 环境 (%或#提示符)
PROM 环境(OK> 提示符)
域正在POST自检,你可以看到POST输出
域管理任务
在系统控制器上你可以访问到Domain Console来执行域管理任务,域管理任务包括:
系统控制器域管理任务 使用的系统控制命令
配置域 setupdomain
从一个域中添加或删除一个板子 addboard, deleteboard
关闭或开启板子 poweron, poweroff
检测CPU/内存板 testboard
设置域开关位置(这个开关可被设置为OFF、STANDBY、DIAG、SECURE) setkeyswitch
显示域的开关设置 showkeyswitch, showdomain
设置日期、时间、区域 setdate
显示日期和时间 showdate
显示环境控制源 showenvironment
虚拟域键开关
这个domain shell为每个域提供了一个虚拟键开关命令(setkeyswitch)。有5种开关设置off (default), on,standby, diag, and secure.这个命令的详细信息见后面的章节。当你把键开关从不活动状态(off, standby),改变为活动状态(on, diag, secure),按次序将会发生如下事件:
属于域的系统板打开
POST通电自检开始进行
所有的OpenBoot PROM都被配置以便这个域使用
SOLARIS操作系统开始运行,如果OpenBoot PROM auto-boot 被设置为TRUE。
环境监控
有传感器监控着温度、电压和电流。系统控制器以某种方式关注着这些传感器,确保环境数据维持在正常的水平。如果需要,系统控制器就关闭部件,以保证系统不被损坏,这将导致域自动关闭。
日志主机(LOGHOST)
系统控制器有永久存储器,存储错误、警告和其他信息。这些信息和SOLARIS的信息相隔离,为便于管理维护,这些信息可以发送到日志主机(LOGHOST)。要查看系统控制器的日志事件可通过系统控制器的showlogs 命令。这个LOGHOST可以是SUN 6800/4810/4800的管理中心软件。要使用SUN 6800/4810/4800中心管理软件,系统控制器必须连接到网络。SUN 6800/4810/4800中心管理软件已经出厂时安装,不需要另外安装。
冗余部件和最小配置介绍
CPU/内存板
所有的系统都支持多个CPU/内存板,每个域至少包含一块CPU/内存板,在一块CPU/内存板上的CPU数量最多是4个,最少是2个,你在订购时,在一块CPU/内存板上可订购2个CPU,也可订购4个CPU。
系统 最大CPU/内存板数 最大CPU数
Sun Fire 6800 system 6 24
Sun Fire 4810 system 3 12
Sun Fire 4800 system 3 12
Sun Fire 3800 system 2 8
在CPU/内存板上有4个内存区,每个内存区需要一个CPU,CPU是内存管理单元。每个内存区有8个插槽,这个内存模块必须4根内存条一组进行安装,为了对一个域进行操作在订购时,需要订购的内存条最小数量是4根。
冗余CPU/内存板
一个CPU失效或内存发生故障时,将会被域通过POST进行隔离,只要有一块CPU控制一个内存区能够正常工作,那么这个域就能够一直运行下去。
I/O集
所有的系统支持多个I/O集,每个系统只支持一种类型的I/O集。3800只支持CompactPCI I/O集,其他系统只支持PCI I/O集,如下所示:
I/O集数量 CompactPCI插槽数量 PCI插槽数量
Sun Fire 6800 system
4 (PCI only) N/A 8 slots—6 slots for fulllength
PCI cards and 2 short
slots for short PCI cards
Sun Fire 4810 system
2 (PCI only) N/A 8 slots—6 slots for fulllength
PCI cards and 2 short
slots for short PCI cards
Sun Fire 4800system
2 (PCI only) N/A 8 slots—6 slots for fulllength
PCI cards and 2 short
slots for short PCI cards
Sun Fire 3800system
2 (CompactPCI only) 6 N/A
你可以安装短的PCI卡到6个长的PCI槽里,长的PCI卡工作在33MHZ(5V)短的PCI卡工作在33MHZ(5V)或66MHZ(3.3V)。
冗余风扇
当有风扇发生故障时,其他的风扇就会提高转速。当更换风扇时,不需要中断系统。
主机 风扇组最小数量 最大数量
Sun Fire 6800 system 3 4
Sun Fire 4810 system 2 3
Sun Fire 4800 system 2 3
Sun Fire 3800 system 3 4
冗余电源
要想使电源冗余,你必须为每组电源安装附加的一定数量的冗余电源。如果一个电源组中的一个或多个电源发生故障,那么系统部件就不能全部加载。系统控制板和I/O板能够从系统中的任一电源得到电源,风扇能够从任一电源组得到电源。
最小电源支持和需要冗余的配置见下表
系统 每系统支持的电源组 每电源组的最小电源数 实现冗余的电源数
Sun Fire 6800 2 2 (grid 0) 3
2 (grid 1) 3
Sun Fire 4810 1 2 (grid 0) 3
Sun Fire 4800 1 2 (grid 0) 3
Sun Fire 3800 1 2 (grid 0) 3
ps0, ps1, and ps2被分配到grid 0,ps3, ps4, and ps5被分配到grid 1,如果一个电源组失效了,剩下的电源组将会继续工作。
下表列出了6800部件供电的情况,其余主机系统参考grid 0就可以了。
部件 grid 0 grid 1
CPU/Memory boards SB0, SB2, SB4 SB1, SB3, SB5
I/O assemblies IB6, IB8 IB7, IB9
Power supplies PS0, PS1, PS2 PS3, PS4, PS5
Repeater boards RP0, RP2 RP1, RP3
Redundant Transfer Switch (RTS) RTS0 (back) RTS1 (front)
转发板
转发板通过交叉矩阵的方式连接到多个CPU/内存板和I/O集,需要一定数量的转发板来为主机系统提供操作支持。转发板不是完全冗于的,当一个SOLARIS正在运行时,如果转发板失效了,那么被转发板承载的那个域的SOLARIS系统将会失效。这个域不能在剩余的转发板上继续操作,如下是在 6800上对每个域转发板的分配:
分区模式 转发板 域
单分区 RP0、RP1、RP2、RP3 A、B
双分区 RP0、RP1 A、B
双分区 RP2、RP3 C、D
在 4800、4810上对每个域转发板的分配:
分区模式 转发板 域
单分区 RP0、RP2 A、B
双分区 RP0 A
双分区 RP2 C
如果一个转发板失效了,为了隔离故障它可能转变成双分区模式。例如:如果你的系统运行在单分区模式下在一个域(DOMAIN A),转发板RP2失效了,那么它就转变成双分区模式允许(DOMAIN A)继续引导。
可靠性、可用性和适用性
这些感觉都是可有可无的东西,就不说了。