FreeNAS 的强大在于 ZFS 文件系统的引入,ZFS 支持丰富的冗余方案,可以方便的将多块硬盘组成 RAID-Z 存储池,当存储池中的硬盘发生故障,系统会在 WebGUI 界面给出提示,同时会给root用户发送通知邮件。

当 RAID-Z 卷(存储池)中某块硬盘发生故障,该卷会变成 DEGRADED 降级状态,如下图所示。作为FreeNAS系统管理者,你应该经常检查卷状态,并第一时间修复处于降级状态的卷。修复方法是尽快用新硬盘替换掉 RAID-Z 卷中的故障硬盘。

如果 FreeNAS 主机开启了 AHCI 支持,则无需重启电脑,可以直接热插拔硬盘。替换硬盘是否需要重启 FreeNAS 系统取决于主机对热插拔功能的支持情况。

注意:由于 stripe 带条卷(相当于RAID 0)没有冗余性。因此,组成 stripe 带条卷的硬盘发生了故障,只能重新创建卷,且带条卷中的已存储的数据都会丢失。

在断开发生故障硬盘的电源线和数据线之前,请先在 WebGUI 管理界面中找到发生故障的那块硬盘,位置: Storage ‣ Volumes ‣ View Volumes 。在存储管理器中单击卷名称,并在下方找到并点击**“Vloume Status” 卷状态**图标,能找到磁盘阵列中发生故障的硬盘,如下图所示。

FreeNAS 替换损坏的硬盘

找到发生故障的硬盘以后,执行下列操作:

  1. 对于 ZFS 卷(存储池),点选故障盘,界面下方会显示 “Offline” 离线按钮。点击该按钮,让该硬盘变成离线状态。操作这一步的目的是将发生故障的磁盘设备妥善的从 ZFS 存储池中移除,同时防止发生交换问题。如果主板支持磁盘热插拔,在硬盘变为离线状态后,即可直接取下故障磁盘,然后跳过下面的第2项,直接按第3项说明继续操作即可。如果下方只有**“Replace” 替换**按钮,说明该磁盘已经离线,可跳过此步操作。
    注意:在将故障盘切换成离线状态的过程中,如果收到错误提示:“disk offline failed – no valid replicas”,则需要先对 ZFS 卷执行一次 scrub 清理操作,位置:*Storage ‣ Volumes ‣ View Volumes,找到并点击 “Scrub Volume” 按钮执行 *。待 scrub 操作完成,再次点击离线按钮。
  2. 如果主板不支持 AHCI,需要关闭 FreeNAS 系统后再取下故障硬盘。
  3. 找到并点选状态为 OFFLINE 离线的硬盘,点击其下方的 “Replace”  替换按钮。在下拉列表中选择新硬盘,然后点击 “Replace Disk” 替换磁盘按钮,ZFS 存储池将开始执行硬盘替换和阵列重建。如果 ZFS 加密卷中的硬盘发生故障,执行替换操作时需要输入加密卷的密码短语。

20150115224120

硬盘替换过程中,可以在** “Shell” 命令行**中输入 zpool status myStor 命令查看阵列重建状态(将命令中的 myStor 替换成实际的卷名称)。

被替换硬盘状态变为 ONLINE 且卷状态也从 DEGRADED 变为 ONLINE,代表硬盘替换成功。