在22日DC-02断电事故之后,RackNerd 的部分客户被告知,由于磁盘损坏,数据很可能无法恢复。此次断电是由于 Multacom 大楼火灾引起的,大火并不在 RackNerd 托管服务器所处的楼层,但由于救火,大楼的电力被切断。起初 RackNerd 认为事态并不严重,并自信数据非常安全。
但之后,RackNerd 发现突然断电导致一部分服务器的 RAID-10 阵列中超过4块硬盘损坏,因此这部分数据难以恢复。RAID-10阵列只能支持同一组中最多2块硬盘损坏。尽管 RackNerd 依然在试图恢复这部分数据,但希望渺茫。RackNerd 已要求受影响客户重新部署系统,重新部署的机器IP将发生变化。RN为此提供一个月托管时长作为补偿。
本次事故暴露了 RackNerd 在容灾方面的短板,再次提醒人们重要业务应当选择较成熟服务商,并尽可能选用可靠性更强的多节点部署云服务器而不是VPS甚至独服。
[消息等级 Level C2 · 简要]