故障描述:IBM X3850服务器5块73G SAS硬盘,其Φ4块组成一个raid阵列5另一块做为热备盘(Hot-Spare),3号硬盘早已经离线但热备盘未自动激活rebuild(原因不明),之后2号盘离线raid阵列崩溃。
操作系统为linux redhat 5.3,應用系统为构架于oracle的一个oa数据重要,时间很急因oracle已经不再对本oa系统提供后续支持,用户要求尽可能数据恢复+操作系统复原
初步检测熱备盘完全无启用,硬盘无明显物理故障无明显同步表现,数据通常可恢复
1、保护原始环境,关闭服务器确保在恢复过程中不再开啟服务器。
2、将故障硬盘标好序号确保在拿出槽位后可以完全复原。
3、将故障硬盘挂载至只读环境对所有故障硬盘使用(没有坏道的凊况)或使用PC 3000 SAS DE完全镜像(。备份完成后交回原故障盘之后的恢复操作直到数据确认无误前不再涉及原故障盘。
4、对备份盘进行raid阵列结构分析得到其原来的raid阵列级别,条带规则条带大小,校验方向META区域等。
5、根据得到的raid阵列信息搭建一组虚拟的raid阵列5环境
6、进行虚拟磁盤及文件系统解释。
7、检测虚拟结构是否正确如不正确,重复4-7过程
8、确定数据无误后,按用户要求回迁数据如果仍然使用原盘,需確定已经完全对原盘做过备份后重建raid阵列,再做回迁回迁操作系统时,可以使用linux livecd或win pe(通常不支持)等进行也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁
9、数据移交后,经客户要求由千喜延长保管数据3天以避免可能忽略的纰漏。