第一部分、系统启动问题
cfgmgr : configures devices and optionally installs device software into the system
last : display all the previous logins and logoffs that still have entries in /var/adm/wtmp file
uptime : show how long the system has been up
要在maintenance mode作 installing new or updated software and running diagnostic checks
alog : trace the boot process and find out if sht went wrong,alog命令调用rc.boot脚本将启动信息导入/var/adm/ras/bootlog中
# alog -L 显示定义在alog Database中的logs
# alog -o -t 显示启动日志
cfgmgr命令:
在系统启动阶段,cfgmgr命令配置对使用系统必须的所有设备
系统启动包括两个阶段:
阶段一: cfgmgr –f 一旦系统启动就不能运行了
阶段二: cfgmgr –s ( second boot phase for normal boot )
阶段三: cfgmgr –p ( second boot phase for service boot )
# cfgmgr –i /usr/sys/inst.images 该命令尝试自动安装设备的软件 FOR 新检测到的设备
-I 选项指定安装的媒质在哪里
在此处有一个seq field ,该field 是一个整数指定了优先权,值越小,优先级越高,0的优先级最低,1的优先级最高
# cfgmgr –l scsi0 ( 配置检测到的连接到SCSI0适配卡的设备 )
-
如果你想查找root用户什么时候logged on and off from the console
# last root console
如果你想决定系统上次shutdown是什么时候
# last shutdown
为了显示一个启动列表
# bootlist –m normal –o
如果你想改变你的启动列表
# bootlist –m normal fd0 hdisk0 cd0
注意:加到bootlist的每一个设备必须处于Avalable的状态
如果你怀疑你的系统被shutdown或restarted,你可以使用uptime命令去查明,uptime命令显示系统已经运行了多长时间
# mpcfg –df To find out what the status is of your diagnostic flags
# mpcfg –cf 11 1 如果你想Fast IPL system,你可以改变diagnostic flag的值
注意: mpcfg 和 service information相关
shutdown
-v 或 –h Halt the operating system completely
-k Avoids shuting down the system
-m Bring the system down to maintenance mode
-I specifies interactive mode , Display interactive messages to guide the user through the shutdown
注意 : /etc/rc.shutdown文件由 /usr/sbin/shutdown script调用来关闭在关机的时候想中断的进程,该文件的必须是可执行的才能被正确调用
安装媒质有问题的征兆:
1、安装时意外挂起 2、 无法从介质读数据 3、意外重起
如果安装媒质没有问题的话,在你的系统中两个设备可能共享相同的SCSI地址
LED Error Code
LED 201 --- Damaged boot image
解决方法:
1、访问你的rootvg ( 进入 system maintenance 模式 )
2、检查 / 和 /tmp文件系统,看看他们是否已经满了,如果是创建更多的空间
3、决定 bootdisk 通过用命令 lslv –m hd5
4、重新创建 boot image 使用 bosboot –a –d /dev/hdisk0
5、检查 CHECKSTOP errors in the error log , 如果这样的错误发现的话可能是失败的硬件
6、关机 重起
LED 223-229 --- Invalid boot list
1、决定启动磁盘 lslv –m hd5
2、创建新的bootlist 使用 bootlist命令
LED 551,555,and 557 --- Errors Including corrupted file system and corrupted JFS log
1、进入维护模式 access rootvg before mounting and file system
2、fsck –y /dev/hd1
fsck –y /dev/hd2
fsck –y /dev/hd3
fsck –y /dev/hd4
fsck –y /dev/hd9var
3、再次Format the JFS log
/usr/sbin/logform /dev/hd8
4、使用 lslv –m hd5 去决定 boot disk
5、重新创建boot image
bosboot –a –d /dev/hdisk0
LED 552,554,and 556 --- Super block corrupted or corrupted customized ODM database
Fsck
1、Repeat steps 1 and 2 for LEDs 551 555 and 557
2、If fsck inidicates that block 8 is corrupted, the super block for the file system is cororupted and needs to be repaired , Enter the command :
Dd count=1 bs=4k skip=31 seek=1 if=/dev/hdn of=/dev/hdn
3、rebuild your JFS log by using the command :
/usr/sbin/logform /dev/hd8
4、if this solves the problem, stop here ; otherwise ,continue with step 5
5、Your ODM database is corrupted ,restart your system and 进入 maintenance mode
6、Mount the root and usr file system
Mount /dev/hd4 /mnt
Mount /usr
7、copy system configuration to a backup directory
mkdir /mnt/etc/objrepos /backup
cp /mnt/etc/objrepos/Cu* /mnt/etc/objrepos /backup
LED 553 --- corrupted /etc/inittab file
1、进入系统维护模式
2、检查 / /var /tmp 使用 df命令
3、检查 /inittab文件
4、检查 execution problems
/etc/environment
/bin/sh
/bin/bsh
/etc/fsck
etc/profile
/.profile
5、shutdown and reboot
第二部分、硬件相关
为了列出系统中的磁带(盘),使用 # lsdev –C –c tape(disk)
列示在预定义ODM数据库中的设备 # lsdev –P –H
列示在定制定义ODM数据库中的设备 # lsdev –C –H
# lspv 显示在系统中的每一个PV along with its physical disk name ,PVID,and with VG it belongs to.
# lspv pvname 仅仅显示该PV的信息 eg: # lspv hdisk0
# lspv –p hdisk0 列示 range , state , region , LV name , type , and mount point for each PP on the PV
cfgmgr 配置设备在软件层
SMS检查和配置系统在硬件层
如何进入SMS:
1、关机
2、如果需要的话插入 SMS 软盘 ,启动机器
3、Press F1 得到一个图形化的 SMS菜单或 Press F4去得到一个ASCII SMS菜单
( 要眼疾手快 )
你可以改变访问的口令在SMS菜单,从而只有授权的人才可以访问SMS工具,但如果你忘了这个口令,唯一的解决方法是给主板放电(将电池拿掉)
当显示一个定制设备的有效属性时,信息的获得是从 Configuration daabase 而不是设备本身,一般来说,chdev with –P or –T flag 将刷新设备的配置,如果没有的话,lsattr 命令显示设备的信息有可能是不准确的,一直到重起后
· # lsattr –El rmt0 显示磁带的当前的属性
· # lsattr –l rmt0 –D 显示磁带默认的属性
· # lsattr –l scsi0 –a bus_intr_lvl –E
· # lsattr –l tty0 –a login –R To list possible values of the login attribute for the TTY device tty0
# smitty devices 该命令可以使用smit菜单
1、安装或配置设备(在IPL之后)
2、删除设备
3、列示存在的设备
4、改变或显示设备的属性
5、执行设备相关的问题的决定
# /usr/lib/errdemon 启动errdemon
# /usr/lib/errdemon –l 决定系统错误日志文件的路径
# errpt 产生错误报告 # errpt –a # errpt –a –s 0828093001
# errpt –a –j AA8AB241(最后为 error identifier )
# errloger 命令允许你记录管理员的信息到系统错误日志中
# diag 执行硬件问题诊断
AIX使用syslogd记录系统的信息,在这里有一个/etc/syslog.conf配置文件,该文件控制syslogd进程的行为,系统日志应该被升级通过编辑/etc/syslog.conf文件,在你编辑并增加了条目在/etc/syslog.conf文件,你需要重新启动syslogd进程
# smitty tty 增加一个TTY
第三部分、系统和软件的安装
为了安装BOS,应该启动系统进入Maintenance mode
三种安装方法的区别:
(1)New and Complete Overwrite Installation
情形一、一台新的机器
情形二、你想安装到那个硬盘(包含在一个已经存在的卷组)你想完全覆盖掉,或者rootvg已经损坏
情形三、你想重新分配你的硬盘,使你的rootvg更小,分配少些磁盘空间给它
安装后要使用 Configuration Assistant application手工配置系统相关设置,该程序也可以手工运行,/usr/sbin/install_assist
(2)Migration Installation (升级安装)
使用该安装方法去升级AIX 3.2 4.1 4.2 4.3 To AIX 5L Version 5.1 升级时保留了已经存在的rootvg卷组,除了/tmp,该方法保留了所有的文件系统,包括rootvg,lv和系统配置文件,同时保留了用户配置文件。
(3)Preservation Installation
该方法覆盖了/usr , /tmp, /var, 和 / 文件系统,在这些目录中任何用户数据将丢失,任何其他的LPP和Filesets将会丢失,系统配置将重做在安装结束后
有一个 /etc/preserve.list文件,在该文件中的条目将会被保留
# bootinfo –y 标示系统硬件的类型 ( 32bit或64bit )
oslevel 的运行
# oslevel ( to see the current maintenance level of your system )
4.3.3.0
软件的组成以及各部分的含义
vv.rr.mmmm.ffff
vv : 两个数字 标示 version number
rr : 两个数字 标示 release number
mmmm: 四个数字 标示 modification lever
ffff: 四个数字 标示 fix level
在升级后,oslevle后,如果你的系统没有显示出新的维护层,使用
After an update, if your system is not showing the new maintenance level . use the –l flag with the oslevle command to detemine what filesets have note been upgraded to match the new BOS levle
# oslevle –l < Current Level 〉去决定还有什么filesets没有被升级到新的BOS Level
PTF and APARs
PTF : Program Temporary Fix , a PTF is an updated fileset or a fileset that fixes a previous system problem
PTF 的安装是使用 installp 命令
APAR: Authorized Program Analysis Report , An APAR is an emergency fix. Or e-fix . to a unique problem on the system , APARS will eventually become PTFs after tesing and verification.
APAR 的安装是使用 instfix 命令
Installp命令
-X 如果在安装过程中空间不够将扩展文件系统
-v 在安装结束后确认在文件集中的所有安装的文件备正确地检查过。可以同-a 和 –ac一起使用来确认一个成功的安装。
-a 应用一个或更多的软件产品或升级,该参数是默认的行为,该参数可以和 –c 一起使用来apply 和 commit一个软件的升级或安装
-p 执行一个安装预览,运行预安装的所有检查
-B 表示请求的行为被限制到软件的升级
-C 清除一个中断的安装和删除所有没有完成的安装
-c commit applied的升级到系统
-d 指定安装媒质
-F 强迫安装,无论是否存在,是否新旧
-f read the names of the software products from listfile
g 当用来install和commit的时候, 该选项自动安装或commit,
软件可以以两种方式进行安装:
applied state: 该状态安装软件到系统同时保留以前版本的软件 ,该状态是非常有用来测试新的软件,在有必要的时候可以返回到以前版本的软件
committed state : 安装软件同时删除以前的软件
例如:
1、安装在 bos.net软件包中的所有的filesets 到 /usr/sys/inst.images目录( in the applied state)
Installp–avX –d/usr/sys/inst.images bos.net
2、预安装在bos.net软件包中的所有的文件集到/usr/sys/inst.images目录( In the committed state )同时检查磁盘空间的需求
3、清除一个中断的安装和删除所有没有完成的安装
# installp –C
4、committing applied updates 命令: # installp –cgx all 或者是 smitty install_commit
这个命令将commit所有的updates同时删除以前版本的filesets
5、Rejecting applied updates 命令 # installp –rBfX ./reject.list或是smitty install_reject
该命令将删除所有uncommitted updates listed in ./reject.list 同时将系统带回到以前的maintenance level
6、删除一个安装的软件 # installp –ugp –V2 bos.net.ipsec.rte 运行该命令将显示一个将要删除的文件的列表,但并不真正删除它 或是 # smitty install_remove
7、列示在媒质上的所有的软件
# installp –L –d /dev/cd0
8、使用s