产品技术
合作伙伴
当前位置:首页 > 成功案例
成功案例
服务器故障
发布时间:2014-09-16 15:58:40     浏览次数:     [打印]

受理信息 受理方式 技佳Raid5数据恢复
客户信息 中科院某研究所 关单日期 2014-09-16
介质描述 品 牌 曙光 型 号
容 量 1TB×16 类 型 Linux
解决方案 故障现象 曙光存储(Raid-5)-两块硬盘离线 恢复结果 成功恢复
故障类型 服务器故障
恢复手段 两块硬盘由于坏道和磁头故障而分别离线,破坏阵列的Raid机制,经技佳工程师提取两块离线硬盘镜像,并用16块硬盘虚拟重组,成功恢复数据。
友情提示 两块硬盘离线使阵列无法运行是Raid-5最常见故障,这是由于1块硬盘离线时,用户未及时发现并排除故障,当另一块硬盘离线,Raid机制丧失才补救,为时已晚。用户应定期关注阵列运行状态,及时排除突发故障。
Raid-5数据恢复
Raid-5原理
图 1. Raid-5存储原理
Raid-5俗称"分布式奇偶校验条带",提供了一组冗余信息P,允许一块硬盘离线而不影响阵列正常运行。这种方式兼顾了性能与安全,是使用最广的阵列模式,但Raid-5并不绝对安全,Raid-5发生数据丢失时,95%都表现为两块硬盘离线,且其中一块往往已离线很久。这是由于第一块硬盘离线后,用户并未及时发现并排除故障,当另一块硬盘离线,Raid机制丧失,阵列无法访问,此时再补救为时已晚。
技佳logo_blue 性能:★★★★              技佳logo_blue 安全:☆☆☆☆
一. Raid-5常见故障
技佳logo_red 两块硬盘离线(亮灯报警),阵列无法运行
技佳logo_red 多块硬盘同时离线(多发生在阵列重启后)
技佳logo_red 阵列卡故障,所有硬盘均亮灯报警
技佳logo_red 误将Raid重建,Raid-5重建Raid-0、Raid-1、Raid-5
技佳logo_red Raid-5中部分文件损坏或无法访问
技佳logo_red Raid-5为未初始化状态,无法访问
二、技佳经典成功案例
三、RAID为什么会发生故障?
RAID故障分析
图 3. RAID为什么会发生故障
从上述成功案例中可以看出,Raid故障通常表现为两块或多块硬盘离线(或亮灯报警),Raid无法正常运行从而造成数据丢失,实际案例中,95%以上的RAID-5故障表现为两块硬盘离线,且其中一块硬盘往往已离线很久。既然RAID针对数据安全提供了不同的容灾手段,为什么还会发生数据丢失?由图3可以看出,数据安全是建立在"硬盘稳定可靠"及"阵列模式安全稳定"两个基础上,它们任何一项出现问题,数据安全就成了岌岌可危的空中楼阁。
(1)磁盘的稳定性及可靠性。这是所有磁盘介质内数据安全的基础,希捷7200.11代硬盘“固件门”事件,让人们开始关注机械硬盘质量对于数据安全的影响。而近几年,随着高密度硬盘普及,厂商为压缩成本,缩减对硬盘质量的把控,造成市面上硬盘质量整体下滑,很多硬盘仅使用几个月就出现故障,在这种前提下,即使采用最安全的阵列模式,数据丢失也不可避免。
(2)阵列模式的安全性。几种主流RAID级别经过多年发展,已非常稳定,但这种安全性被过分夸大后,就会给用户造成“Raid是100%安全”的错觉,使用户放松警惕。当阵列中一块硬盘出现故障,Raid仍可正常运行,多数用户不会及时排除故障,当第二块硬盘发生故障后,RAID机制丧失,阵列崩溃,此时才开始补救,为时已晚。
(表1)列举了常见的RAID故障及其表现形式:
RAID故障表现
表 1. RAID故障表现
四、RAID故障后的正确操作
RAID故障后的正确操作
图 4. RAID故障后的正确操作
1. 及时关机,切勿长时间开机运行。由于服务器(Raid阵列)多采用高性能SAS硬盘,转速可达10000RPM甚至15000RPM,在实际案例中,经常遇到用户不及时断电,导致碟片与磁头长时间接触,使磁粉脱落,造成数据无法恢复的重大损失。因此,服务器(Raid阵列)发生故障后,应及时关机,切勿反复开机尝试。
2. 切勿反复重启。Raid(尤其Raid-5或Raid-6)无法运行时,故障现象通常表现为两块或多块硬盘离线,而其中一块硬盘往往已离线很久,有时这块硬盘是由于逻辑原因离线,而重启后,该硬盘上线参与同步操作,造成阵列数据"污染"。
3. 切勿盲目更换硬盘进行同步操作。由于Raid的容灾机制,及时将故障硬盘替换后,Raid会自行完成同步操作。但实际案例中,同步没有完成,其它硬盘又离线的情况很多,这是由于同步过程进行。
4. 致电正规数据恢复机构寻求帮助。目前中国数据恢复市场鱼龙混杂,不同恢复机构的技术水平和职业素质千差万别,正规机构价格较高,但成功率很高,用户应慎重选择,切勿贪图便宜造成无法挽回的损失。
五、RAID日常维护友情提示
技佳数据恢复友情提示
表 2. RAID故障友情提示
六、科普知识-RAID常见级别及适用范围
RAID(独立冗余磁盘阵列)是大数据时代最好的存储手段,它既解决了单块硬盘容量无法达到使用要求的问题,又提供了不同级别的灾备措施,用户可根据需要灵活定制适用的阵列模式来存储大容量数据,常见的阵列方式有以下几种:
常见的RAID级别
图 5. 常见的Raid级别
常见RAID级别说明
表 3. 常见Raid级别说明
技佳数据恢复logo 联系我们
办公地址 办公地址:北京市海淀区北三环西路99号西海国际中心3号楼812室
服务热线 服务热线(全国24小时):400-806-7787
直拨电话 服务热线(9:00-18:00):010-81059940/81059941
电子邮箱 电子邮箱:service@databack.com.cn
分享到:
网站地图 |  关于技佳 |  合作伙伴 |  友情链接
Beijing Databack Technology Development Co.,Ltd. All rights reserved.
北京技佳瑞康科技发展有限公司 版权所有  
Copyright @ 2012-2015
公网安备:11010802013182号 工信部备案:京ICP备13032780号