2018.10.14 晴

 

 

大前天远程检查的时候发现服务器主力节点离线,前往实验室检查情况。

熟悉的症状,电源灯常亮,硬盘灯不亮,键盘鼠标显示器均无响应,按以往经验直接重启。重启后进入桌面,intel存储管理服务提示硬盘smart状态异常,决定打开hdtune看一下smart数据。hdtune正在加载中,瞬间蓝屏,错误代码“critical_process_died”。当时我就慌了,再次重启,直接开hdtune,smart信息里,重新分配扇区计数数据是2046,警告阈值是36,我刚拍完这个信息的照片,再次蓝屏,错误代码同上。

强行关闭之后,取下硬盘,接上易驱线连到另一台服务器上,准备抢救。连接之后,炸了的硬盘还能正常访问文件,这时候我做出了第一个错误的决定,决定直接把硬盘克隆到另一个正常的盘上。打开diskgenius开始克隆,连续报错,扇区读取失败。按暂停终止均无响应,当时有点着急,就直接终止dg进程了。再次打开dg之后,发现炸了的硬盘文件目录全部消失,变成无法访问的状态。这里,第二个错误的决定,我决定重建分区表。这次是从扇区0就开始报错。彻底慌了,强行停止然后拆下来找大佬做数据恢复去了……

被我这么一折腾,感觉可能要没救了(绝望脸),里边还有一堆没备份的工程文件……当时决定克隆硬盘的时候,想的是不想重装系统还有那么多软件……结果现在系统也没了数据也没了……当时应该优先确保数据安全的……

总之,这次翻车之后,日常注意检查smart信息,重视报错提示,抢救的时候以数据的保存为优先,不要觉得快死的硬盘还能撑过克隆硬盘这种折腾……另一个,不在垃圾硬盘上保存无法重复取得的重要数据,明明有个nas可以比较安全的保存文件的。希望工程文件和各种数据能抢救回来吧……