信息化的年代离不开网络,服务器是网络不可缺少的部件,所以造就了近代服务器业的迅速发展。而在服务器硬件故障中,内存故障列举首位。内存故障导致服务器数据永久丢失或系统宕机。这样会给企业或个人带来无法估计的灾难。所以近来服务器厂商在采用越来越多的技术来保障内存的稳定性。我们所知道的主要有奇偶校验技术、ECC技术和IBM的Chipkill-correct ECC技术。现在本人又发觉了两种内存冗余技术:内存热备和内存镜像。这两种技术用于浪潮服务器。这两种技术道底是怎样的呢?下面为大家介绍一下。
内存热备—Sparing
进行内存热备时,做热备份的内存在正常情况下是不使用的,也就是说系统是看不到这部分内存容量的。每个内存通道中有一个DIMM不被使用,预留为热备内存。芯片组中设置有内存校验错误次数的阈值, 即每单位时间发生错误的次数。当工作内存的故障次数达到这个“容错阈值”,系统开始进行双重写动作,一个写入主内存,一个写入热备内存,当系统检测到两个内存数据一致后,热备内存就代替主内存工作,故障内存被禁用,这样就完成了热备内存接替故障内存工作的任务,有效避免了系统由于内存故障而导致数据丢失或系统宕机。这个做热备的内存容量应大于等于所在通道的最大内存条的容量,以满足内存数据迁移的最大容量需求。
内存镜像—Mirroring内存镜像是将内存数据做两个拷贝,分别放在主内存和镜像内存中。系统工作时会向两个内存中同时写入数据,因此使得内存数据有两套完整的备份。由于采用通道间交叉镜像的方式,所以每个通道都有一套完整的内存数据拷贝。
在系统芯片组中设置有 “容错阈值”。假如任意内存达到了“容错阈值”,其所在通道就被标示出来,另一个通道单独工作。但仍然保持双通道的内存带宽。
内存镜像有效避免了由于内存故障而导致数据丢失。从上图中可看出,镜像内存和主内存互成对角线分布,假如其中一个通道出现故障不能继续工作,另一个通道仍然具有故障通道的内存数据,有效防止了由于内存通道故障导致的数据丢失,极大提升了服务器可靠性。镜像内存的容量要大于等于主内存容量,当系统工作时,镜像内存不会被系统识别。因此在投资方面,做内存镜像数据保护的投资是没有内存保护功能的一倍。