スポンサーリンク
HDDの故障率を紹介する海外事業者の恒例の記事の紹介。
大容量ストレージデバイスであるHDDについてのまとめはこちら。
前回の記事はこちら。
恒例のUSのBackBlaze社の公表データのご紹介。以前の仕事での経験をもとに、同社のデータをみて勝手に考察する。
今回は2022年(1-12月)の状況。
BackBlaze社はクラウドストレージなどのサービスを提供するUSの会社だ。同社は12月末時点で235,608台のストレージ(HDD,SSD)を利用している。4,299台がOSブートドライブだ。それと231,309台のデータドライブだ。
データ用の231,309台について書かれているが、テスト用途の388台と60台に満たない種類のストレージは外されている。このため、下表の230,921台がレポートの対象になっている。
2022年の特徴は下記の3点だ。一方で2022年に仲間入りした新しいドライブがある。
大容量化により8TBドライブもずいぶん安くなった。(円安のせいであまり実感できなかったが)。一方で16TBとさらに大容量のドライブも登場し、設置場所とギガバイト当たりの単価で有利になる場合があり、徐々に増えてきている。ソフトウェアの対応が必要ではあるが、対応していたら迷わず大容量HDDを選択したいところ。(RAIDの再構築には相当の時間がかかることが欠点だが)
ではこの3年間のAFRの傾向はどうだろうか。3年間使っているドライブで比較したものが下表だ。
表の一番下に平均のAFRがあるが、2022年はそれまでよりも故障率、AFRが上昇して1.37%になっている。表を見ていくと、3%を超えるAFRのドライブが6種類もあった。2020年は0,2021年は1種類だったが。ドライブ数が多いものは老朽化、少ないものは新しいもので初期不良と考えられる。
下表は容量で分類した、2021年と2022年のAFRの比較だが、大容量(12,14,16TB)のほうがAFRは小さい。なおかつ2021年からのAFR上昇も小さい。
Drive Dayに占める割合からも小容量ドライブのほうが故障が多いようだ。
12TB以上のドライブは熱アシスト磁気記録方式など新たな方法で密度を上げているので、10TB以下の容量と比べてディスクが少ない、機械機構の改良が進んでいるのかもしれない。
ドライブ日数と故障率の相関を下図に示す。簡単に言えば老朽化すると故障しやすい。
容量別にAFRを示すと、下表のように大容量ほどAFRは小さい。ただし大容量のものは使用日数も少ないので参考資料か。
下図は製造メーカ別のAFRをグラフにしたものだ。Seagateを多数使っているせいなのか、SeagateのAFRが一番高い。あるいはSeagateのそういうドライブにあたってしまったのかもしれない。(おそらく後者だろう)
HDDは何年寿命が持つだろう。故障が頻発して全部故障するまで待つ、というのは事業をする身としては得策ではない。あらかじめ決めたAFRに達したら全数交換するくらいが運用コストを下げることができる。
下表ではライフタイムAFRが1.39%となっている。年あたり1000台中14台が故障する計算だ。5年続けると70台故障となる。このくらいならまだ全数交換しなくてもいいだろう。
しかし少ない故障がサービス停止に至った、などあれば全数交換のタイミングになる。この辺りはその会社の運用ポリシーになるので一概には言えない。
2022年通年の結果はAFRの上昇だった。老朽化によるものと思われるが、一方で大容量ドライブの故障率の低さが際立っている。
ドライブスロットの削減もできるので、大容量ドライブへの移行が始まるのかもしれない。
PR