日経エレクトロニクス4月23日号でも紹介されているが、先頃Google社は記憶装置関連の学会でハードディスクの故障に関する論文「Failure Trends in a Large Disk Drive Population」を発表した。同社が運用する世界最大規模のサーバーシステムで使用した10万台以上のハードディスクから取得したデータである。この膨大な実証結果から見えてきたのは今までの常識(予測)とは少し違うものであった。
従来ハードディスクが故障する原因としては以下のように考えられてきた。
1.使用頻度が高い(負荷が高い)
2.使用期間が長い(劣化している)
3.動作温度が高い(劣化が早い)
ところが、結果から見えてきたのは、
1.3ヶ月に限っては使用頻度が高いものが群を抜いて故障する確率は高いが、それ以外は使用頻度に相関関係を見ることはできない。
2.期間が3年を超えると故障率があがってくるが、1年や6ヶ月に比べて3ヶ月以内に故障する確率は高lい。
3.温度が45度以上になると故障率が上がるが、むしろ25度以下の低温のほうが故障率が高い。
というものである。
そのほかにも、
・スキャンエラーが見つかったものは見つからなかったものより故障率が10倍高い。
・今のハードディスクに標準搭載されているS.M.A.R.T.の警告なしに故障するものが4割弱あった。
ということも発表された。
これらの結果は従来の常識をくつがえすものでしょう。実感として、半年以内に調子の悪くなるハードディスクが多々あった事実は品質の低さではなかったようです。私は故障率は人の死亡率に似ているように思います。「生まれてすぐ」と「年老いてから」が注意で、「運動してない」人も注意、「年老いてからの急激な運動」も注意というところでしょうか。
興味あるからはリンクからPDFファイルがダウンロードできます。英文ですがグラフは読めるでしょう。皆さんはそこから何を思うでしょうか。