IrvineのもっとPC自作日記
【AT独占】mineo(マイネオ)
テレワークにおすすめのモバイルPC
本ページはプロモーションが含まれています。
  
 

【自作NAS】 NAS4Freeのドライブ故障に対応する

 

スポンサーリンク

 
【自作NAS】 NAS4Freeのドライブ故障に対応する
 

いつものようにバックアップしたファイルをNASにコピー仕掛けて外出。
帰宅後終わってないことがわかる。途中で転送が止まっているようだ。前にもあったドライブ故障の話。
NAS4Free/Xigma NASについてのまとめはこちら。

このストレージの記事もチェック!
  

まずは確認

XigmaNASの情報タブからディスクの状態を見ると、前と同じで3TBプールがDegradedになっている。
そしてドライブ1台がUNAVAILABLEになっていた。エラー多発で切り離されたのだろう。

DEGRADED状態

DEGRADED状態

しかし普通のNASなら、プールがDegraded状態になってもコピーはできるはずなのだがなあ。
冗長性がなくなったのでプールを保護したのだろうか。故障が発生したHDDのシリアル番号を控えて、電源を落とした。

HDD交換

前回もやっているので不安はないはずだが、やっぱり不安を感じる。前回はこちら。

まずは、HDDを探す。
エンタープライズ向けのサーバなら故障したベイを特定できるようにLEDを点灯するような機能があるのだが、コンシューマ向けのPCケースでは当然そんな機能はない。
ついでに言えば、活線挿抜も通常はできないから、NASは必ず停止だ。シリアル番号が書かれたHDDのシールを頼りに探すと、前回故障した一つ下に設置した、5インチベイのものだった。
冷却面で問題があるかなと思っていたが、5インチベイであることにより振動などの要因もあるのかな。

故障したHDD

故障したHDD

ドライブを入れ替えて設置。ケーブルを繫いで電源を入れて、XigmaNASの管理コンソールにログインする。状態を見ると、3TBだけでなくなぜか4TBのプールもDegradedになっている。あれ?
取り合えず、4TBの方はおいておき、3TBの作業をする。

交換作業

ディスクのZFSメニューからプールの状態を表示する。抜いたトライブと代わりに入れたドライブは同じada4として認識されている。

プール状態

プール状態

ここからツールメニューを開き、Replaceを選択する。次へボタンをクリックして、交換する故障したドライブと、新しいドライブを指定する。

ZFSツール画面

1ZFSツール画面

ZFSプール選択

2ZFSプール選択

ドライブの指定

3ドライブの指定

コマンド実行結果

4コマンド実行結果

これでリビルドが始まった。12時間くらいかかる見込みだ。

リビルド中状態

リビルド中状態

待つ間に次のことをする。

SMART情報の確認

待っている間に、故障したドライブのSMART情報を確認する。USB3.1 Gen1とSATAを変換する器具で接続する。

created by Rinker
¥2,854 (2024/11/22 16:58:29時点 楽天市場調べ-詳細)

アフィリエイト広告  ここから購入いただきますと当ブログに報酬が支払われ、運営資金になります。

ものによっては、USB接続ではSMART情報を取得できないので注意。幸い、これはできている。以前も似たようなことをした。
タイムシフト用HDDが壊れて交換したときだ。

今回はCrystal Disk Infoを使って、情報を取得する。
Linuxではコマンドラインが一般的なので、こういうツールは助かる。

SMART情報とは

ところでSMART情報だが、ストレージのヘルス状態を示す、ドライブが持つパラメータを取得する仕組みだ。
ある程度は業界の標準がある。(特にSSDでは、ベンダ固有のパラメータもありベンダの定義情報がないと解釈できないが。)
この中で、自分が気にするパラメータがいくつかある。

  • Reallocated Sectors
  • Currently Pending Sectors
  • CRC errors

これらが0でなくなったら、そのドライブはエラーが発生しており、故障になる可能性がある。エンタープライズ向けなら、一定の閾値を超えたらドライブを交換するだろう。
しかしSOHOなど仕事で使っているわけでもない個人用途では、故障してからでも間に合うことが多いと考える。このため、自分は常にSMART情報を見て監視しているわけではない。
Xigma NASでは設定すれば決まった時間にシステムの状態をメール送信してくれる。この中にSMART情報も含まれているので、読む時間があれば対応できなくはない。
しかし自分のようにバックアップが主目的でファイル共有はめったにしない場合、NASは日常的には電源を切っている。

このためそんなに劣化が進まないと考えて、デスクトップ用の安いHDDで揃えている。ハードを安く揃えたのに、頻繁にSMART情報を見るのもなあ。
見えない運用コストが気になる。とはいっても、月に一回ぐらいは全ドライブのSMARTを見ることにするかな。で、故障したドライブを見ると、やはり3つのパラメータのいくつかが0でなくなっていた。

SMART情報

SMART情報

SMART情報が健全であっても壊れることはあるのであくまでも目安でしかないが、今回は裏付けになった。
このドライブはもう使えない。近々データが壊れる前提でしか使えない。ついでに前回の故障で交換したHDDも見た。これは代替セクタを使い切っている感じだ。

SMART情報(5月故障)

SMART情報(5月故障)

一方で4TBプールの調査

14時間でリビルドが終わった。正常に戻った。それから、システムを停止して中を見た。なんと、前回開けたときに3.5インチベイの一番下にある4TBドライブのSATAケーブルを
側板が噛んでしまい、外れていた。ちょうどロゴの真下にある。

外れていたケーブル

外れていたケーブル

ケーブルが多いので、今後は気をつけないといけないな。戻すと2つともプールは復活した。

復旧後のプール状態

復旧後のプール状態

2回やってやり方もわかっている。今後は安心してできそうだ。

PR

   
著者プロフィール
irvine
 ソフトウェア設計、ストレージ設計を経てクラウドにかかわる仕事をしている、東京郊外在住のエンジニア。
 仕事でUS,UK,SGなどの国とかかわる。
 自作PC、スマホ、タブレット、AV機器好き。ドラクエウォークはルーチンワーク。Linuxやストレージ、IT業界の動向は興味を持っている。
 新しい機器、サービスに興味あり。年数回のレビュー(自腹購入、ご依頼)と発表されて興味があるものの新製品机上レビューをやっている。
 2022年はJAPANNEXT様のアンバサダーを務めました。
 
 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です