【转载】 服务器在线
导读:惠普利用3种容错内存保护技术,在线备份内存、热插拔镜像内存和热插拔RAID内存来解决增加内存的密度、增大内存的容量的同时,保证系统内存的可靠性的难题。
关键词: HP
惠普热插拔RAID内存的读操作,每个从存储盒中读出的数据都经过一个内存控制器和一个ECC驱动器进行检错。同时RAID内存引擎将通过其它4个内存控制器重新生成数据将其与从内存盒中读出的数据进行比较。
RAID 内存结构
回写(Scrubbing)
热插拔RAID内存提供了一个回写硬件方式,它可以确认ECC或RAID 检查出来的软错误。惠普技术尝试定位在读内存时检查出来的所有软错误,方法是把改正后的正确的数据写回内存中去。但此方法不适用于硬错误。
回写技术可以阻止软错误的累积,避免发生更严重的错误。它降低了ECC 的工作量,提高了系统的性能。一些传统的系统采用的是软件回写, 惠普热插拔RAID内存使用硬件完成这个工作。
惠普热插拔RAID内存会对错误生成错误日志,错误极限由软件设定。当记录的错误值达到错误极限的时候,软件会自动作出反应。例如当超过错误极限的时候故障灯会自动点亮,这就是由软件控制的。
热插拔容量 Hot-Plug Capabilities
惠普热插拔RAID内存可以允许用户在不关闭服务器电源的情况下在线更换、在线扩展以及在线升级DIMM。
在线更换指在系统运行的情况下更换出现故障的DIMM 。惠普热插拔RAID内存不需要操作系统的支持,服务器在购买的时候就具有支持在线更换的能力。
在线扩展指用户在空的插槽上插入DIMM以扩展系统容量,在线升级是指用户用容量更大的DIMM替代旧的较小容量的DIMM。在线扩展和在线升级都可以使用户获得更大的系统内存容量。在线扩展和在线升级要求操作系统的支持,系统要可以认出新增的内存。Microsoft Windows?Advanced Server, Windows?Data Center, Novell NetWare 6.0, and SCO UnixWare 7.1.2 可以支持惠普ProLiant 700系列服务器。惠普也会和其它的操作系统开发商合作,保证他们未来的操作系统版本中支持此项功能的实现。
当在线内存操作完成后,如果工作在热插拔RAID内存模式下,那么系统会自动在所有的内存盒上重新放置数据(rebuild)。虽然这样做会暂时降低内存的工作性能-重新放置4 GB的数据花费时间少于30秒-但是只需要花费很少的钱就可以增加容错能力,并可避免系统检修期间带来的经济损失。
总结
由于应用程序越来越复杂对内存要求越来越高,同时处理器的处理能力也更强,服务器内存的扩展已经是必然的事情。要满足这个要求,服务器的制造商面临的问题就是在增加内存的密度、增大内存的容量的同时,保证系统内存的可靠性。
惠普也面临同样的问题,它的解决办法是利用3种容错内存保护技术(fault-tolerant memory protection technologies):在线备份内存、热插拔镜像内存和热插拔RAID内存。在线备份内存适用于那些不想因为仅内存错误就停机检修设备的用户,他们希望利用固定的设备检修时间更换出现故障的内存模块。热插拔镜像内存能够为此类用户提供更高的容错能力,而且用户也无须等到设备固定的检修时间才更换出现故障的内存,因为热插拔镜像内存可以让用户在不关机的情况下对内存进行在线替换。对于那些需要大容量内存支持且长时间不间断运行的应用程序而言,惠普热插拔RAID 内存的可靠性******。它可以保证内存子系统运行正常,即使是在有一个内存设备完全出现故障的情况下也是如此,它支持工业标准的DIMM在线替换、在线扩展和在线升级。
以上的惠普AMP技术是系统可靠性的保证,可以让用户根据自己对内存可靠性的要求自由选择系统配置,为其工作的成功打下基础。