分享
 
 
 

HP UNIX服务器转储失败原因

王朝system·作者佚名  2008-05-31
窄屏简体版  字體: |||超大  

问题描述

我的系统挂起 (hang) 的时候,我执行了一个 TOC(Transfer_Of_Control)以强制进行内存转储,但在重新引导之后 savecrash 显示没有可保存的有效转储。或者在系统崩溃时,未保存任何转储。

配置信息

HP UNIX 11.00 和 11.11

解决方法

转储概念

系统硬件检测错误 (HPMC)、操作系统引起的恐慌 (Panic) 以及系统挂起 (hang) 必须提供有关失败原因的信息,这样才能制定出一个解决方案。HPUX 使用的方法需要创建系统内存转储、发生故障时的 Kernel 状态快照,HP 解决方案从这些内容进行分析才能提供根本的原因以及补救措施。 Kernel 产生于 /stand/system 文件,它通常包含一个到转储设备 (默认状态下为 Swap Logical Volume) 的矢量 (指针)。进行引导时,该矢量将拷贝到不可变内存中。假如发生了前面提到的故障,硬件会将来自可疑操作系统的处理重新定向到固件例程 (firmware routine),以保存该转储。这些固件副本会将部分 RAM 拷贝到该转储矢量指向的目标磁盘中。

对于可疑操作系统,转储之后会进行重新引导。

重新引导过程中执行的 /sbin/init.d/savecrash 会导致 savecrash 命令检查该转储设备是否存在有效转储 (注重 1)。假如存在有效转储,savecrash 则会将其拷贝到一个预先确定的文件系统,在此系统中用户可以对这些数据进行操作以提取有用信息,假如不存在,savecrash 则会退出。

转储失败的原因可能是:

o Kernel 中没有转储矢量

o 有缺陷的 PDC 固件,即无法正确执行 TOC

o Kernel 中转储矢量已损坏,即无效堆栈设备

o 有缺陷的转储设备,即磁盘无法接收 RAM 快照

o 电源或其他抢占转储保存例程的其它硬件故障

o 堆栈已损坏,通常是由于硬件故障引起的

Kernel 中没有转储矢量

检查 /stand/system 文件,寻找无转储规则或表明: dump none 的内容。假如不存在这样的内容,则添加转储 lvol 行并重新生成该 Kernel。

有缺陷的 PDC 固件

有缺陷的 PDC 固件需要 CE 对其进行重新编写。PDC 固件版本记录在 /var/tombstones/ts99 中,或者可以通过 STM 查看。

TOC 矢量已损坏

Kernel 中或 HP 应用软件中存在已知的缺陷,这些缺陷可能损坏了 Kernel 内存中的 TOC 矢量,以至 TOC 无法定位转储设备。这种情况的症状是强制的 TOC 似乎会挂起 (hang)。

下列补丁程序已经修正了 TOC 矢量损坏问题。 10.20: PHSS_14978 :PDCINFO:A.02.24:TOC:vector:corruption: 11.00: PHSS_14982 :PDCINFO:A.02.24:TOC:vector:corruption: PHKL_20937 :PANIC:TOC:core dump: 11.04: PHKL_23017 :VVOS:PANIC:TOC:core:dump: 有缺陷的转储设备

转储设备通常为 Swap Logical Volume,该设备与引导 lvol 及 root lvol 位于同一个磁盘中。假如 Kernel 出现如挂起这样的问题,则可能表示磁盘要发生问题。引导问题和转储问题是其他的指示内容。

硬件、电源故障

有时候,系统崩溃的根本原因是由于电源系统问题而导致的电源短缺。这自然不会进行转储。

转储已损坏

savecrash 命令检查转储是否存在有效转储时,它会寻找一个转储 magic number (注重 1)。假如由于硬件故障而无法生成有效的 magic number,则该转储本身可能已经损坏了。

注重 1: UNIX 文件 (包括 Kernel 及转储映象) 在文件开始都有一个 "magic number" 来识别它们所代表的文件类型。当 PDC 将其拷贝到转储设备时,它会在 RAM 快照的开始放置一个 "dump magic number"。假如 TOC 没有成功,则该 "dump magic number" 不会出现在转储设备的预期位置上。

注重 2: 转储设备默认为 Swap Logical Volume。系统治理员可以根据需要添加更多的 Swap 设备。为了确定转储设备,请执行下面的命令:

# lvlnboot -v /dev/vg00

Boot Definitions for Volume Group /dev/vg00:

Physical Volumes belonging in Root Volume Group:

/dev/dsk/c1t5d0 (52.5.0) -- Boot Disk

/dev/dsk/c1t6d0 (52.6.0) -- Boot Disk

Boot: lvol1 on: /dev/dsk/c1t6d0

Root: lvol3 on: /dev/dsk/c1t6d0

Swap: lvol2 on: /dev/dsk/c1t6d0

Dump: lvol2 on: /dev/dsk/c1t6d0, 0

注重 3: savecrash (11.X) = savecore (10.X HPUX)

另请参阅 man crashconf(2)、/usr/share/doc/sys_crash.txt、 /etc/rc.config.d/savecrash /etc/rc.config.d/crashconf

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有