だめねこ飼育日誌 By suteneko
リネ2関連で検索して来たかたはこっちのwikiのほうがいいかも // プロフィール


2008-12-30 (Tue)

[サーバ][近況] HDD入れ替え [09:11]

年末ですね、なんか時間がせわしなく流れていってる気がします。

いくらせわしなくても、この人の車には乗りたく……あぁぁわ゛た゛し゛ま゛た゛し゛に゛た゛く゛な゛い゛ぃ゛ぃ゛ぃ゛・・・



 □ □ □



失礼、取り乱しました。しかし5秒の間に8通、その34秒後にもう1通なんて、ゆかり先生わたしを狙わないでください しにたくないです



いくらか茄子もあったので、サーバのRAIDカード(3ware社製 9500S-4LP)に繋げているHDDを、やっと入れ替えました。

もちろん

ツクモ支援で。



実は2ヶ月くらい前から壊れ気味で、エラー出てたんです。FreeBSDは毎日メールでサーバ状態のチェックを送ってくるのですが、そこにこんな文が毎日ありました。

+twa0: ERROR: (0x04: 0x0002): : unit=0, port=0
+twa0: INFO: (0x04: 0x000B): : unit=0
+twa0: INFO: (0x04: 0x0005): : unit=0

RAID5なんで1台壊れたところでデータは大丈夫なんです。でも1台壊れてる状態だと冗長性なくなっちゃって、単体のHDDより故障率が増えるという状態に。

# /usr/local/sbin/smartctl -a --device=3ware,0 /dev/twa0 | less

こうやるとSMARTでエラーが見れます。less で /Error とかやって、SMART Error Log のところとか Error Ratio のところとか見てみます。

うちのRAIDカードにはHDDが4台繋がっているので、3ware,0のところを3ware,3まで変えて /Error とやってみました。

…わぁぁ。0「と」3にエラーが出てるよぉ。

orz



…この状態で2ヶ月すぎました ;;; オカネナカッタンダモン

鯖つかってるみんな、ホントスマンカッタ… ;;;



 □ □ □



さて、うちのRAIDカードに繋がってたHDDは、Maxtor 6B200M0 というモデルでした。換えとして買っておいた HDD は既に交換に使ってしまって予備は残っていません。

このHDD、200Gという、今や手に入らない容量なんですよね…。どこの通販サイト見ても160Gの上は250Gで、200なんて中途半端?な容量は置いてありません。

おそらく1プラッタ40Gでしょうから、たぶん両面2枚+片面1枚なんでしょう。出始めのころは、6面つくって1面で不良品が出たものを5面で売ることができたのでしょうけど、不良品率が下がったら5面にする意味ってありませんものね。


昔のRAIDカードだと同一型番のHDDでしかRAIDを組めないとかあったのですが、最近のは容量が上なら大丈夫なはず。さてうちのRAIDカードは、と……

……記述が見つかりません。私の探し方が悪いのかもしれないけれど、良いとも駄目とも書いてありません。うぐっ… 英語読むの苦手;;


ま、まぁ、もし使えなかったら4台総入れ替えじゃぁぁえいやぁぁぁ そのかわりしばらく昼食が質素ヽ(`Д´)ノウワァァァン


ぽちっ (注文ボタン)



 □ □ □



数日後、商品届く。宅急便のおっちゃん「きゅーじゅーきゅーさんから荷物です」とか言ってた。商品名「パソコンパーツ」で代金引換だと、えっちぃ通販とかと間違えられないかと不安です・w・;

トラブっても対処できる時間を確保して、入れ替え。


現在の状態を表示し、エラーのある p0 と p3 のシリアルをメモ。

#/usr/local/sbin/tw_cli info c0

RAID構成から外して、入れ替え。電源は入れたまんま。

#/usr/local/sbin/tw_cli remove c0 p0

HDDを物理的に取り外し、新しいものと入れ替え。後で番号が判らなくなるのでシリアルをテプラで書いて貼り付け。取り付けた後、入れ替えたHDDを認識させる。

#/usr/local/sbin/tw_cli rescan

認識したHDDで再構築。

#/usr/local/sbin/tw_cli rebuild c0 u0 p0

これで1時間ほど待ち。info c0 して、%Coml が 100% に行って Status が DEGRADED から OK になるのを待つ。

これを p0 と p3 の2セット繰り返し。



 □ □ □



今回は前のときと違って、トラブルなく進めることができました。現在の状態はこんな感じ。

#/usr/local/sbin/tw_cli info c0

Unit UnitType Status %Cmpl Stripe Size(GB) Cache AVerify OvrECC
------------------------------------------------------------------------------
u0 RAID-5 OK - 64K 558.762 ON ON OFF


Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 GEK234RH25HTWA
p1 OK u0 189.92 GB 398297088 B4217DXH
p2 OK u0 189.92 GB 398297088 B4205PWH
p3 OK u0 232.88 GB 488397168 GEK234RH1ZYJ0A

50Gx2が無駄になっているけど、そんなことはキニシナイ方向で。4台買うより安かったもんね。



でもやっぱり予備のHDDを持っていない厄年な (s) でした。わは…。

来年は、良いことあるといいなぁ…

本日のツッコミ