スキップしてメイン コンテンツに移動

投稿

ラベル(Server系)が付いた投稿を表示しています

RAID5 崩壊 Windows2008 Server のデータ復旧事例

現象:RAID5 崩壊
OS:Windows2008 Server
メーカー:Dell 社
原因:ハードディスク障害
フラグ:データ復旧成功



・状況についてお客様談:Windows2008 Server をファイルサーバとして使っていた。前日は問題なかったものの、朝一番からアクセスできない。モニターを接続し確認するとフリーズしていた。過去に違うマシンの RAID5 でトラブった時は、故障ハードディスクを外しただけで復活した。今回その時復活したようにハードディスクを外すも復活しなかった。自動バックアップのソフトを入れていたが… なぜか半年前で止まっていた。データだけでもなんとかしたい。


・RAID5 故障の原因と注意点3番のハードディスクにセクタ不良が発生していました。ちなみにセクタ不良とはハードディスクの記録面の故障です。記録面に障害があれば読み出すことも書き込むこともできません。ただし記録面全面が一気に壊れることはありません。部分的な故障が大半です。

RAID5 で 4 台構成のため、1 台のハードディスクに故障があっても残りの 3 台で稼働できます。したがって通常であれば、問題なく動作します。それではなぜ 1 台のハードディスク故障で稼働しなくなってしまったのでしょうか… それはセクタ不良に原因があります。

故障と言ってもこのセクタ不良の場合はまだまだ稼働できます。とはいえ、応答速度が遅くなるなど不安定にはなります。そしてある程度進行すると、まともに動作しなくなります。初期の段階では故障というよりも、余命が決まったような感じと言えるでしょう。

そしてまともに動作しなくなった段階でコンピュータからは故障と切り離されますが、許容の範囲で動作が不安定な段階では切り離されません。ちなみに進行が早いケースもあれば遅いケースもあります。

そこで悪化の進行が早いケースではスパッと切り離されますが、進行が遅く踏ん張ってしまうと、むしろ不安定な状態が長く続くため、誤作動するなど足を引っ張ることになります。そして誤作動が多ければ多いほど、このようなイレギュラーなトラブルにつながります。ちなみに通常であれば、ハードディスク 3 台構成で問題なく動作します。

RAID であっても、今回のようにアレイが崩壊してしまったり(RAID構成の情報が消えた)、また間違えてデータを消した、、ウイルスにデータを壊された…

RAID10(0+1) SQL Server のデータ復旧事例

現象:RAID10(0+1) が Degraded で起動しない
OS:Windows XP + SQL Server
メーカー:Epson Endeavor
原因:ハードディスク障害
フラグ:データ復旧成功



・状況についてお客様談:RAID10(0+1) ポート2のハードディスクが故障し、メーカーより送られてきたハードディスクに交換した。特に問題なく動作していた。その他 3台のハードディスクをメンテナンス(予防交換)した時にトラブルが発生。ポート0を交換後した際に Windows エラーで起動せず。しかし、元のハードディスクに戻すと正常起動した。次にポート1を交換したところこちらも Windows エラーで起動せず。元のハードディスクに戻すが、Unknown Disk になってしまい RAID10(0+1) のボリュームが Degraded になってしまった。ポート1は再度新旧差し替えたが復活できなかった。部門で使っている SQL Server と共有フォルダ。


・RAID10(0+1) が Degraded の原因と注意点RAID10(0+1) とは RAID0 をミラーリングした RAID0 × 2 構成です。そして画面上「Volume0」と一つのボリュームになっており構成が不明ですが、解析したところポートの0と2でひとつの RAID0。ポートの1と3でミラーリングの RAID0 でした。

したがって、ポート0と2が生きていれば再び起動しますが、ポート2を解析したところリビルドが完了していない状態でした(ポート2は最初に交換)。つまりポートの0と2は2がリビルド中。ポートの1と3は3でエラーのため起動しない状況でした。

補足ですが、ポート0と3とクロスして接続しても起動することはできません。あくまでも RAID0 × 2 構成、こちらの RAID の場合は、ポート0+2 Or ポート1+3 の組み合わせのみになります。

また「次にポート1を交換したところこちらも Windows エラーで起動せず。元のハードディスクに戻すが、Unknown Disk …」とあります。ハードディスクを戻せば元どおりになりますが、搭載されているすべてのハードディスクにセクタ不良がありました。気付かないところでどんどん劣化が進んでいる状況で、RAID崩壊は時間の問題でした。

ちなみにセクタ不良とはハー…

PowerEdge RAID コントローラ故障のデータ復旧事例

現象:RAID コントローラ故障で起動しない
OS:Windows Server 2003
メーカー:DELL PowerEdge840 (RAID0)
原因:RAID コントローラ故障
フラグ:データ復旧成功



・状況についてお客様談:古くなった Windows Server 2003 をファイルサーバに使っていた。ネットワークから見えないため、サーバを再起動させると停止してしまう。DELLサポに問い合わせたところ、RAID BIOS画面が表示されないので、RAIDコントローラ故障と判明。さらにコントローラの部品提供は終了で在庫がないとのこと。翌日までになんとかデータだけでも復旧しないと仕事が止まってしまう。しかし、RAID0 で手が付けられない。


・補足と注意点についてRAID には、RAID1 や RAID5、10 と複数のディスクにバックアップを持つタイプもあります。仮にひとつのディスクに故障が発生しても停止することはありません。そして理論上故障に強いのですが、今回のように RAID コントローラが壊れてしまえば一発でアウトです。そういった意味ではアキレス腱と言えるでしょう。

ちなみにですが、RAID コントローラが壊れた場合は、新品のコントローラに差し替えることで復活します。ところが、故障時に誤作動しアレイを壊していることもあり、新品のコントローラに差し替えた時に RAID がすでに崩壊していることもあります。

そこで RAID ボリュームを削除してしまったり、もしうかつな設定の変更をしてしまうと、致命傷を与えてしまうことがあります。もし万が一、RAID が崩壊している場合は作業ミスなどではなく、既に壊れていたということですので重要なデータほどお早めにご相談ください。

なお、同時に複数のディスクが壊れてしまってもアウトです。RAID マシンに搭載されているハードディスクはロットが同じケースがほとんどで、つまり同時期に生産されたハードディスクのため、同時に壊れることも多々あります。

つまりどの RAID 構成であっても故障に「完璧」に強いというわけではありません。必ずバックアップをとって保護してください。

ちなみにですが、共有フォルダのバックアップについては、自動化できるソフトウェアもありますのでご利用ください。当社ではバックアップシステムの構築サービスも行っておりますのでぜひお…

RAID0崩壊「 Operating System not found 」で Server が起動しないの復旧事例

現象:「 Operating System not found 」で起動不可
OS:Windows Server 2003
メーカー: 自作?
原因:RAID障害
フラグ:データ復旧成功



・状況についてお客様談:ファイルサーバーにアクセスできない。モニターをつなげると「 Operating System not found 」が表示され起動しない。対処法をネットで調べ、まず BIOS を調べる。ハードディスクを認識している。プライマリに別のハードディスクをインストールしサルベージした記事を発見。試したところ既存のディスクを認識しない。最後に Windows CD-ROM から「fixboot」及び「fixmbr」コマンドを試してみる。

ちなみに、退職したスタッフが設置したものだったのでヘルプを頼むと、RAID0 でありデータは取り出せないということが判明。バックアップ用の USBハードディスクが接続されていたがバックアップを取っていなかった。3年くらい前までのデータはあり。


・補足について「 Operating System not found 」は BIOS が準備しているエラーメッセージです。そのため原因が同じで OS を問わず( Windows XP でも、Windows7(Vista)でも)表示されます。

このトラブルの概要については、「 Operating System not found 」でパソコンが起動しないときの対処法 で確認してください。当社ホームページのコラムで解説しています。なお、ハードディスクの設定値が消失していたり、ハードディスク故障といった理由でハードディスクを認識できないと表示されます。


・原因と注意点についてRAID0 に Fail が発生していたため「 Operating System not found 」で起動不可でした。原因はハードディスク設定値の消失です。ハードディスクは異常なし。

ここで注意したいのは RAID0 のボリュームを削除してしまったり、とにかく手を加えてしまうことです。どの RAID 構成であっても、うかつな設定の変更は致命傷を与えてしまうことがあります。RAID0 はもともと難易度が高いため、致命傷を与えてしまうと救出率はグンと下がります。

なお、ハードディスクを認識しない原因はさまざまで、通電しているだけでも悪化させてしまう…