UAP14475 のブログⅢ

Yahoo!ブログから引っ越してきました。パソコンとトイガンが大好物です。  暇になると艦これを始めてしまいます。とにかく秘書艦は阿武隈ちゃんで。

死にかけのHDDがデータ破壊してる説

一昨日の26日、Barracuda7200.14Ⅴ(ST3000DM001) を接続したところ、異音が発生しました。
カッコン音(磁気ヘッドの位置決め失敗)と、スピンドルモーターが再スピンアップする音がしたため、
直ちにデータの取り出しを開始し、すべてのデータを転送することに成功しました。

このHDDには、報道番組の録画データ(TSファイル)を保管していました。
TSファイルには、エラー検出機能と限定的なエラー訂正機能が搭載されており、
専用のソフトウェアを使うことでエラーの検出を行うことが可能となっています。



そこで、今回取り出したデータをチェックしたところ、以下のような結果となりました。

f:id:UAP14475:20200727103200p:plain:w600
  ↑ Multi2Dec によるエラーチェック。WD30EZRZⅤに移した2019年12月録画のファイル群を対象とした。

馴染みがない人にはわかりにくいと思いますが、以下の特徴が見受けられます。
  ・ 同期エラー、フォーマットエラー、ビットエラーが多くのファイルに発生している
  ・ パケットドロップが全体的にやや多い

パケットドロップが発生することはそう珍しい事でもない*1 んですが、録画機に異常がない状態では
出てもせいぜい1~3パケットが普通で、10も出ればファイル作成後の破損が疑われると思います。
また、パケットのドロップは連続的ではなく分散していて、ほとんどは映像ストリームのドロップです。*2

そして特徴的なのがパケットドロップ以外のエラーで、これらは正常な録画機であればほぼ発生しないものです。
録画したばかりのファイルを大量に検査しても、一つもこれらのエラーは見つからないため、
録画機から保管用HDDに引き上げた後で起こったものとみて間違いないと思います。



上のファイル群の中でも特にエラーの多い、
『 日曜報道 THE PRIME【韓国アイドルの死と“誹謗中傷社会”】 』 *3
を TsCheck で検査したところ以下のような結果になりました。

pid=0x0000, total= 51602, d= 0, e= 0, scrambling=0
pid=0x0001, total= 517, d= 0, e= 0, scrambling=0
pid=0x0010, total= 5161, d= 0, e= 0, scrambling=0
pid=0x0011, total= 2580, d= 0, e= 0, scrambling=0
pid=0x0012, total= 220282, d= 0, e= 0, scrambling=0
pid=0x0014, total= 1032, d= 0, e= 0, scrambling=0
pid=0x0023, total= 946, d= 0, e= 0, scrambling=0
pid=0x0024, total= 5160, d= 0, e= 0, scrambling=0
pid=0x0027, total= 25821, d= 0, e= 0, scrambling=0
pid=0x0028, total= 143, d= 0, e= 0, scrambling=0
pid=0x0029, total= 86, d= 0, e= 0, scrambling=0
pid=0x0060, total= 51544, d= 0, e= 0, scrambling=0
pid=0x0100, total= 89218, d= 0, e= 0, scrambling=0
pid=0x0101, total= 51600, d= 0, e= 0, scrambling=0
pid=0x0111, total=46268346, d= 8, e= 0, scrambling=0
pid=0x0112, total= 678182, d= 0, e= 0, scrambling=0
pid=0x0114, total= 4572, d= 0, e= 0, scrambling=0
pid=0x0115, total= 5117, d= 0, e= 0, scrambling=0
pid=0x0810, total= 1372282, d= 0, e= 0, scrambling=0
pid=0x0811, total= 1029234, d= 1, e= 0, scrambling=0
pid=0x0816, total= 3430097, d= 3, e= 0, scrambling=0

[Resync Report] FileSize=10019186460
Sync error at 487555816(4.87%) → Resume at 487556192
Sync error at 2516436776(25.12%) → Resume at 2516437152
Sync error at 3429614440(34.23%) → Resume at 3429614816
Sync error at 4714153768(47.05%) → Resume at 4714154144
Sync error at 5252457740(52.42%) → Resume at 5252458116
Sync error at 5862072556(58.51%) → Resume at 5862072932
Sync error at 6860464416(68.47%) → Resume at 6860464792
Sync error at 7508973424(74.95%) → Resume at 7508973612

[Drop Report]
PID:0x111 004:11.00
PID:0x111 021:39.07
PID:0x111 029:25.90
PID:0x111 040:21.22
PID:0x111 044:59.34
PID:0x111 050:15.99
PID:0x111 058:50.48
PID:0x111 064:23.83



各エラーの識別は以下のようなものではないかと思います。

  ・ 期待される位置にパケットがない ・・・ 同期エラー *4
  ・ パケットはあるがデコードに失敗した ・・・ フォーマットエラー
  ・ デコードしたがエラーが検出された ・・・ ビットエラー
  ・ パケットの中身が空になっている ・・・ ドロップ

なお、地上デジタル放送の1パケットは188バイトで、HDDのセクターは512~4096バイトなので、
エラーセクター発生でセクターごと破壊された場合は3~22パケットのバースト誤りとなることが予想されます。
が、今回検査したファイルではバースト誤りがほとんど見られなかったため、
おそらくはセクターごと破壊されているのとは異なる状況にあると思われます。*5

個人的には再スピンアップの発生に注目していて、これはスピンドルモーターの異常によるものではないかと考えています。
軸ブレやスリーブベアリングの潤滑油の劣化により、偏心や回転数異常が発生しているのではないかと思うんです。
もちろん、これらは個人で証明できるようなことではないので予想でしかないんですが・・・

とりあえず、Barracuda7200.14(ST3000DM001)は事故を多発させているということで、
早急に置き換えを進めていきたいと、改めて決心しました。 ( 以前から進めてはいる )
最近は6TB新品・4TB中古に良い出物があるようなので、積極的な買い付けを行いたいと思います。
容量密度が高いほど電力効率の向上も狙えてエコでもあります。


f:id:UAP14475:20200728155639j:plain:w600
  ↑ 事故を起こした Barracuda7200.14Ⅴ(ST3000DM001の5号機)。

1TBプラッター採用の7200rpmで高速、しかも容量単価が非常に安くて魅力的なHDDでしたが・・・
とんでもない故障率の地雷HDDでした。我が家には3TBモデルが9台と2TBモデルが1台あります。
経験則上、連続運転では2~3年ほどで死亡します。

厄介なのはエラーセクタが出ることなく、異音を出し始めてから数か月以内に死亡してしまうことで、
もし異音に気づかなければ完全な突然死となり、データを取り出せなくなるリスクが高いのです。
今回のデータ取り出しもギリギリのタイミングだったのではないかと思います。 ( データ壊れてたしね・・・ )





■撮影機材
Canon IXY DIGITAL 50
前に別のBarracuda7200.14(3号機か?)にRARファイルを保管していたところ、エラーチェックではねられまして、
チェックしてみたら64KBのエラー *6 が数個ずつ検出されるという事故も発生しています。
RARは修復できますが、プログラムファイル等を入れてた場合は結構マズいことになるんではないかと思います。
まあ何にしてもBarracuda7200.14君はもう戦力外通告不可避ですね・・・

*1:特にPID:0x130の字幕ストリーム(?)はPMTの切り替わり地点で1パケットのドロップを生じることが多い。これはおそらく地デジの仕様上の問題。PID:0x110などの映像ストリームでもごくまれにドロップすることがあるが、電気的なノイズか何かの影響と思われる。

*2:放送内容にもよるが、8割~9割程度が映像ストリームのパケット。つまり録画中であれ保管中であれ、映像ストリームにドロップが出る確率が80~90%、それ以外にドロップが出る確率が10~20%。

*3:元KARAのク・ハラさんがSNS上での中傷を苦として自殺したとみられる事件。いわゆる”指殺人”。間接的とはいえ、その後もSNS(正確にはSNS利用者)に殺される人が出ている。有名人だから取り上げられているが、これが氷山の一角だとすればSNSを間接的な死因とする死者数はどれくらいいるんだろうか? 私はSNSRSS替わりにしか使ってないが、やはりこういうことがあるとゾッとする。

*4:このページを参照⇒https://partnerhelp.netflixstudios.com/hc/ja/articles/214931718-M2TS-%E3%83%91%E3%82%B1%E3%83%83%E3%83%88%E5%90%8C%E6%9C%9FNetFlixMPEG-2TSを使うのか・・・(x264とかだと思った)

*5:実際、S.M.A.R.T.情報にもエラーセクタの発生や存在は記録されていない。

*6:おそらくRARファイルのエラー訂正機能の最小単位。クラスターサイズはたしか4KBだったはず。