IrvineのもっとPC自作日記
【AT独占】mineo(マイネオ)
テレワークにおすすめのモバイルPC
本ページはプロモーションが含まれています。
  
 

【DM-SMR】WDのHDDがRAIDに対応できない事案が発生

 

スポンサーリンク

 
【DM-SMR】WDのHDDがRAIDに対応できない事案が発生
   

WD製のNAS用Redシリーズがモデルチェンジ後にRAID構築できなくなったそうだ。状況を確認する。
大容量ストレージデバイスであるHDDについてのまとめはこちら。

  
このストレージの記事もチェック!
  

この記事のポイント

  • WD製のNAS用ドライブをつかったRAID再構築が失敗する話が出ていた
  • WDの安価なBlueライン、RedラインはDM-SMRに置き換わったとWDが認めている
  • DM-SMR方式ではRAIDに使えない。これは困った

 

どういうこと?

そもそもの情報は、下記のもの。

Block and Files社の記事によれば、WD製の2TB-6TBのNAS用のHDDであるRedシリーズが最近のモデルチェンジでRAIDに使えなくなったそうだ。

理由は簡単で、それまでのHDDの記録方式であるCMR方式を、SMR方式に変えてしまったようだ。

CMRとSMR

CMRとSMRってなに?という疑問に答える。
CMRは昔からのHDDの記録方式だ。Randomアクセスに対応する方式だ。

一方でSMRは5年ほど前から出てきた、同じプラッタ構成でも容量を増加できる記録方式だ。
Read時に磁性体を見る面積は変わらないものの、Write時は書き込む面積を狭めて密度を高める。まあ素晴らしい。

もちろん裏がある、
そのために、隣の書き込みデータと重ねて(Shingled)書き込む。それゆえ、書き込むと隣のデータのエリアへの上書きも発生するため、それを訂正するために隣のブロックの書き込みをしなければならない。という感じである程度のブロックをすべて書き直す必要がある。たった1バイト書き直すだけで、数ブロック=512バイト×nブロックを書き直す必要がある。
このためランダムアクセスには向かず、コールドストレージのようなシーケンシャルアクセスに向いている。

Write時に書き込む面積を狭くできるので(従来方式の磁性体への記録だが、重ね書きしているので見かけ上は面積が減る)記録容量が増える。
つまり、容量が増加できる代わりにランダムアクセスは向かないドライブになる。

DM-SMRとは

SMRのドライブでは書き込みにCMRよりも長く時間がかかる。このため性能面で問題が出る。これはSMR方式が出てきたころからの課題だ。

対策のため、HDD内にCMR相当のキャッシュエリアをおき、HDDが忙しくない時にせっせとSMR領域に書き込む方式ができたようだ。これをDM-SMRと呼ぶそうだ。
丁度キャッシュをSSD、データをHDDで保管する方法と同じような2階層だ。これがWDなどストレージベンダが販売しているDM-SMR方式のHDDの正体だ。
ちなみに、SMRは当初ホスト側、つまりPC側から制御する必要があった。これを改良したDM-SMR、Device Managed SMRSMRであることをホスト側に見せないようにするために差分をデバイス側に隠ぺいしている。この方法により、DM-SMRは従来からあるCMR方式のHDDと同等の方法で使えるようになったものだ。

RAIDを構成できない問題

問題視されているRAID構成ができない話だが、上記の記事によるとRAIDを構成するHDDが故障したため、ドライブを交換したらエラーがでたようだ。RAIDを再構築できなかったそうだ。

the latest iteration of WD REDs (WDx0EFAX replacing WDx0EFRX) being unable to be used for rebuilding RAID[56] or ZFS RAIDZ sets: They rebuiild for a while (1-2 hours), then throw errors and get kicked out of the set.

これはかなり重症だ。WD0xEFAXシリーズのHDDではRAID再構築時にエラーが多発する。
これでは自分が良く遭遇する問題と同じく、RAID崩壊を招き、再構築になる

記事によれば、WDへの聞き込みでNAS用のデバイスの2TB-6TBのモデルはすべてDrive Managed SMR(DM-SMR)であることをWD担当者が認めている。

RAID構築中にエラーになる原因の推測

DM-SMRのドライブがRAID構築中にエラーになるとはどういうことだろうか。原因を推測してみる。

CMRで構成するキャッシュの空きがあるうちは、HDDはホスト(PC)からのデータの書き込みを受け付けることができる。
しかしキャッシュに空きがなくなると、HDDはホストにエラーを返すことになる。書き込むエリアがないのでエラーを返すしかないからだ。

これがRAID構成時にエラーになる原因と思われる。
エラーを返されたPCは何のことかわからないが、エラーなのでドライブが故障したと判断するのだろう。このためRAIDの再構築を中止してしまう。
何度やってもエラーになるのはドライブが故障しているからではなく、一定量のCMRで構成するキャッシュがいっぱいになるタイミングが同じだからだろう。

RAIDにドライブを投入したときは、同期(Resilvering)のために大量の書き込みが発生する。
書き出されたデータはCMRで構成するキャッシュ領域に書き込まれるが、RAIDの同期中なので書き込みが続く。キャッシュをSMR領域に書き出す空き時間があるわけでもないので、キャッシュは減る一方だ。そしてCMRのキャッシュ領域をオーバしてエラーを返し、同期途中で停止してしまう。

DM-SMRはRAIDに向いたドライブではないようだ。今後は注意が必要だ。

今後の対応

おそらく低価格なラインナップはDM-SMRになっていくだろう。となると自分が愛用するデスクトップ向けのWD BlueシリーズもDM-SMRになっているのかもしれない。
(2023年4月25日追記:実際そうなった。WD60EZAZのような6TBドライブが安価になったのはうれしかったのだが)

これらがRAID構成に向かないとなると、自作NASサーバにも使えない。WD RedシリーズというNAS向けというシリーズも使えないとなるとどのドライブを使えばよいのだろう。
HDD3社のうち他の2社も同様な状況と聞く。暫く状況を見るにしても、一度突撃してみるかな。

続き


2023年4月25日追記
その後しばらくはDM-SMRのドライブしかなく、仕方なくCMRを購入できた3TB、4TBのドライブだけをNASに使っていた。
しかし状況が変わって、8TBでもCMRのドライブがWDから出た。WD80EAZZだ。
詳細はこちら。

PR

   
著者プロフィール
irvine
 ソフトウェア設計、ストレージ設計を経てクラウドにかかわる仕事をしている、東京郊外在住のエンジニア。
 仕事でUS,UK,SGなどの国とかかわる。
 自作PC、スマホ、タブレット、AV機器好き。ドラクエウォークはルーチンワーク。Linuxやストレージ、IT業界の動向は興味を持っている。
 新しい機器、サービスに興味あり。年数回のレビュー(自腹購入、ご依頼)と発表されて興味があるものの新製品机上レビューをやっている。
 2022年はJAPANNEXT様のアンバサダーを務めました。
 
 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です