IrvineのもっとPC自作日記
本ページはプロモーションが含まれています。
  
 

【故障率調査】安定した高性能HDDを求める旅2023年通年

 

スポンサーリンク

 
【故障率調査】安定した高性能HDDを求める旅2023年通年
   

HDDの故障率を紹介する海外事業者の恒例のBackBlaze社の記事の紹介。今回は2023年通年の統計情報に基づく考察。
大容量ストレージデバイスであるHDDについてのまとめはこちら。

連載記事はこちら
  
このストレージの記事もチェック!
  

2023年通年の情報

前回の記事はこちら。

恒例のUSのBackBlaze社の公表データのご紹介。以前の仕事での経験をもとに、同社のデータをみて勝手に考察する。

今回は2023年を通したもので、1月から12月の統計になっている。。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年 出典:BackBlaze以下同じ

レポートの概要

BackBlaze社はクラウドストレージなどのサービスを提供するUSの会社だ。同社は12月末時点で274,622 台のドライブを使っている。このうち、OSブート用が 4,400 台、データ用ドライブは 270,222 台だった。OSブート用は徐々にSSDに置き換わりつつある一方で、大容量が必要なデータ用はまだまだHDDが活躍している。
270,222 台のHDDから統計上の理由、テスト用、ホットドライブのため除外した466台を除いた269,756台について、故障の実態調査を行っている。

まずは1年間の実績

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

まずは1年間の故障の実態を見てみよう。気づくことがいくつかある。

故障0台のドライブ

今年は1種類だけある。Seagateの8TB、ST8000NM000Aだ。かつて同社は4TBのSeagateモデルで苦しんだ経緯があるので品質向上はとてもうれしいだろう。このモデル、実際には2022年の3Qから使っているそうで、それ以来障害は発生していないそうだ。1年半も故障がないということになる。
ただしドライブ台数が少ないので、ラッキーなだけかもしれない。

4,189台の故障発生

2023年は4,189台が壊れた。平均的には2時間ごとに故障が発生して交換していたそうだ。これはやっていられないレベルだ。例えば4か所のデータセンターで同様に発生しているとしたら8時間に1回(昼夜問わず)故障のアラートが入って、交換作業をすることになる。運要員は毎日何らかの保守作業をしているってことになり、効率的ではない。
もっともRAIDレベルによっては支給交換する必要がない場合もある。同社では夜間作業はしていないのか、昼間の8時間作業に限定して「30分に1回交換」と書いている。
RAIDは一見便利だ。例えばRAID1であれば、2台に同時に書き込むので1台が壊れてももう1台でサービスを継続できる。その前提はHDDはそんなに頻繁に壊れないだろうという楽観だ。
しかし現実的には1台が壊れて、1時間後にもう1台も壊れる可能性だってある。1時間ではResyncも間に合わないのでデータはロストされてしまう。
そういう事態を考えると、故障の予兆が出たら壊れるまで待たず積極的に交換するほうが良いと自分は考えるが、その代わりHDDの費用がかさむ。
プレミアムサービスとしてしか成立しないのが難点だ。

過去3年間の比較

2021年~23年の統計の比較がされている。
2023年にDrive Days(ドライブ数×運転日数の総和)が20万日を超えたものだけが対象だ。
20万日というのは途方もなく大きな時間であるが、3年間に及ぶ統計から有意な情報を得るのに同社はこの日数でフィルタにかけたようだ。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

AFRの増加

2023年のAFR(年間平均故障率)は1.7%と上昇している。2021年から徐々に上がっている。これは同社によればドライブを使用する年数が経ったから、つまりバスタブ曲線でいうと終わりに入ったドライブが多くなって、故障率が上がったとみている。
平均使用年数が6年以上のドライブが9種類ある。これらは6年間、休みなく動いているわけだ。故障しないはずはない。

年間故障率とドライブサイズの相関関係

興味深いグラフだ。過去3年間のドライブサイズごとの年間故障率をグラフにしたものだ。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

8TB,10TB,12TBのドライブは似た傾向を示している。2021年はAFRが1%程度であったが、2023年末は2%以上に増加した。
4TBは途中で増加したがその後減少し、他は1%前後で推移している。

4TBはそのまま継続して使っていればどんどんAFRが増加したところ、16TBドライブへの移行を行って数が少なくなったようだ。このため増加から減少したと考えられる。8~12TBも4TBと同様の傾向を示していると思われる。16TBはまだ新しい。6TBの動きが奇妙だ。

2013年以来のAFR

では3年間ではなく統計データがある10年前からはどうだろうというのが次の表だ。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

Seagateのモデルが災害級の24%という大きなAFRを見せつけている。しかし全モデルの平均でみれば、AFRは1.46%とそんなに大きくはない。

さらに統計的な信用性を得るため。200万日以上使ってきた23種類のドライブのみに絞り込むと下表になる。AFRは1.44%となった。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

ベンダ別の傾向

これも興味深いグラフだ。現在ではHDDは3社しか作っていない。WD、Seagate、東芝だ。WEの下には過去に買収したHGSTがある。
3社とWD傘下のHGSTの4つでモデル別にAFRとDrive Daysをプロットしたものが次のグラフだ。大きな円ほどドライブ数が多い。また縦軸はAFRなので故障率が高いドライブであり、横軸はDrive Months、つまりドライブを使い続けている月数だ。右に行くほど長く使っているドライブといえる。
一般的には右に行けば上にも行く。つまり原点を始点として右肩上がりなグラフになりそうだ。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

ところが!
HGSTは何となく右に行っても上に行かない。Seagateは何となく右肩上がり。東芝はまだ日数が浅いのだろうか、左に寄っているが保護上がっていない。WDも同様だ。
Seagateのみが通常の常識で考えられる動きで、他は使っていても壊れないドライブになっているように見える。
壊れないものなんて孫際しないのだから何か秘密がありそうだ。ヘッドかな、モータかな。

それからSeagateについて各モデルをつなぐ近似式を計算したグラフが次のものだ。下のものは2次多項式で近似している。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

こちらは7年以上使っているドライブを除いて近似をやり直したもの。これにすると右肩上がりだ。

Back Blaze社 ドライブ故障 2023通年

Back Blaze社 ドライブ故障 2023通年

この不思議な現象を解くカギはヘリウム封入であると同社は書いている。4TBまでは空気だ。以後は摩擦を減らすためヘリウムになっている。
これが転換点なのかもしれないが、まだ断定できるだけのデータにはなっていないようだ。
言えることは、4TB,6TBのように小容量かつ空気封入のものよりも8TB以上のヘリウム封入に変えれば故障率が下がりそうということだ。

まとめ

10年に及ぶ統計データが出てきたのはありがたい。なかなかこういう情報ってないから。
しかしヘリウム封入が最近のHDD故障率の改善に寄与しているかも、という話は驚きと納得を持って自分では受け入れている。
摩擦が減ることで無理な力がモータにかからなくなり、結果的に長寿命に寄与しているもかもしれない。

次回もBack Blaze社のレポートに期待。

PR

   
著者プロフィール
irvine
 ソフトウェア設計、ストレージ設計を経てクラウドにかかわる仕事をしている、東京郊外在住のエンジニア。
 仕事でUS,UK,SGなどの国とかかわる。
 自作PC、スマホ、タブレット、AV機器好き。ドラクエウォークはルーチンワーク。Linuxやストレージ、IT業界の動向は興味を持っている。
 新しい機器、サービスに興味あり。年数回のレビュー(自腹購入、ご依頼)と発表されて興味があるものの新製品机上レビューをやっている。
 2022年はJAPANNEXT様のアンバサダーを務めました。
 
 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です