スポンサーリンク
HDDの故障率を紹介する海外事業者がSSDについても統計をまとめた。今回は2023年の中間。
高速ストレージデバイスであるSSDについてのまとめはこちら。
HDDについての故障率のまとめはこちら。
USのBackBlaze社は数年にわたってHDDの故障率について統計をまとめてきているが、システムがSSDに移行してきているのでSSDについてもまとめ始めた。
今回は2022年の通年の情報に続いて、2023年の中間だ。
では見ていこう。
BackBlaze社はクラウドストレージなどのサービスを提供するUSの会社だ。同社はSSDをサーバのブートドライブとして使っている。同社はSSDを2018年Q4から使い始め、新規のサーバやブートドライブのHDDが壊れた際にSSDに置き換えている。ブートドライブは毎日ログや一時ファイルの読み、書き、削除がされている。
2022年末から、238台が増えている。数が多いのはCrucialのCT250MX500SSD1で110台、次いでWDのSA510 2.5が62台だ。
2023年6月時点の年間故障率を見ていこう。この時点で3,144台のSSDがある。1Qと2QのAFRを見ていく。
1Qの全モデルのAFRが0.96%、2Qが1.05%と微増している。
といっても故障なしのモデルもいくつかある中で、1QのSeagateのSSDSCKKB240GZRのようにAFRが829.55%と途方もない数値が出たりしている。
これについては考察が書かれている。
SeagateのSSDSCKKB240GZRは、1Qで2台しかないのに1台がインスチール直後に故障して、このためAFRが800%超と高くなっている。
2Qでは残る1台は故障することなく動いていたようだ。このためAFRは0%。
どっちもAFRではあるが、意味のある値ではない。
理由は単純で、統計的に優位なサンプル数がないからだ。
BackBlaze社のレポートでは統計的に有意なデータのみを取り出している。その基準は、3か月で100台のドライブと10,0000Drive Dayだ。
3か月ごとのAFRの推移は下図のとおりだ。
ここからわかることは、AFRの急上昇は特定モデルの影響であることが多く、モデル構成を是正することでAFRが下降するということだ。
2021年Q1のAFRが0.58%だが、その後1.51%、1.72%まで上昇している。調査の結果、このAFRの上昇は1モデルの問題とわかり、このモデルをサーバから除去して以後はAFRが下降したそうだ。
いわゆるサーバとの相性、というものかもしれない。SSDのベンダもサーバのベンダもいくつもあるので、動作保証がされた組み合わせはまあまあ少ないものだ。
ベンダごとに最近(60日)とライフタイムのAFRを比較したものが下図だ。
例えばこのグラフからは、MicronのSSDのAFRが高くなったとわかる。これをトリガにして調査を行い、必要ならSSDの特定モデルを利用中止にするという運用が可能だ。
SSDはまだ比較的新しいデバイスなので、HDDのように故障率がバスタブ曲線になるか、という点が明確になっていない。
BackBlaze社では、平均故障期間は当初2年7か月だったそうだ。
稼働期間が長くなるにつれてデータがとれており、故障対期間のグラフを描いている。
ん-、一般的なバスタブ曲線とはちょっと形が異なる。凸凹が大きく、前半よりは後半で大きく落ちている。
が、その傾向を2次多項式で描くと緩やかなカーブを描き、なんとなくバスタブっぽく見える。
でもまだ時期尚早かな。
SSDのライフタイムの年間故障率は下表になる。
2018年Q4からBackBlaze社はSSDを使用しているが、2023年Q2までのライフタイムAFRは0.9%となった。2022年Q4は0.89%であったのでわずかに上昇している。
この表のモデルから、統計的に有意さがある100台のドライブ、10,000 Drive dayを満たすモデルのみを抽出したものが下表だ。
これによりAFRの上昇に影響があった、故障率の高いドライブが排除され、AFRは0.72%に下降している。
安定して稼働しているSSDのみの統計だから、自然と故障数も少ない、だからAFRが下がったといえよう。
さらに信頼区間が1%以下であることが望ましいことから、モデルを抽出すると下表のようにさらにAFRが下がる。
今後はこの手法をブラッシュアップしていくものと思われる。
SSDは数が少ないので統計情報としてはまだ成熟していない。今後の同社の活躍を期待。
PR