今日の戯言 by maa
基本的にただの独り言です。有益な情報を求めてはいけませんw
基本的にただの独り言です。有益な情報を求めてはいけませんw
不調だった RAID デバイスの件だが、ちょくちょく起動に失敗することが多く、そんなときに BIOS を立ち上げて確認すると、SATA 3 番ポートに接続されている HDD が認識されていないようだった。HDD が悪いのか、つないでいる SATA ケーブルが悪いのかと、とっかえひっかえ試してみるもどうやらそうではないらしい。となると、マザーボード上の 3 番ポートそのものの調子が悪いとしか思えない。そこで、3 番ポートを未使用にしてほかのポートに差し替えると問題は解決した。ただし、RAID のデータは壊れてしまい、無料のパーティション操作ソフトでは破損データの修復はできない(有料版を買えといわれた)始末。何のための RAID だったのだろう... RAID といえども、HDD そのものの故障には対応できるが、SATA ポートそのものやケーブルの不具合から発生した不調では、データの損傷が起きる可能性があり、そうなってしまうとどうしようもないということらしい。
世の中売られている PC は基本 64bit 機であるが、古いマシンを大事に(なかなか捨てられないだけだが...)使っている方のもとには、まだまだ 32bit 機はたくさん存在していると思う。私のもとにも 1 台だけだが存在していて、それがこのサーバーの予備機だったりする。
このサーバーに使っている OS である Linux の各ディストリビューションが次々と 32bit 機のサポートを停止する中、ここで使っている Debian/GNU Linux もまた、次期バージョンで 32bit のサポート終了を検討しているとの話が伝わってきていたので、次の予備機はどうしようとなんとなく悩んでいたのであった。とりあえず、実際使っていないが Windows のライセンスを放棄するのももったいないので Windows 10 Windows 11(先日無理やりアップグレードした)を入れている Core2 Quad の古い PC(よく考えてみればメインサーバーも Core2 Quad で、次期予備機候補の方が動作クロックが高い...)を贄とするしかないなぁなどと考えていたが、朗報?が舞い込んできた。
Debian、32ビットの「2038年問題」に対応へ に舵を切ったようだ。とりあえず予備機延命決定か、それとも、せっかく 32bit 機を捨てる機会を失ったと考えるべきか微妙なところである。
最近、なんかサブの PC といいながら、ほぼほぼメイン扱いで使用頻度が高い PC の起動がおかしいと思っていたら、RAID のデータディスクがまるまる見えなくなっていた。BIOS から見ると 3 台中 2 台も認識していない。明らかにおかしいので、筐体開けて HDD の電源や SATA のコネクタをグリグリツンツンしてから電源入れなおしたら全部認識して起動した。RAID マネージャ開くと 2 台目の HDD の再構築が始まっていた。こういう怪しいけど動いてしまう状態というのは気が抜けないので勘弁してほしい。
今年の仕事始めは暦の関係で今日9日とのんびりだったが、元旦の能登半島の大地震、翌2日の羽田空港での大事故、ついでに国会議員の逮捕と尋常じゃない始まりだ。おまけに今朝車での出勤中に妻から電話があり、2軒先のアパート(お隣さん横の路地を挟んで向かいアパート)が燃えているとのこと...1時間ほどで鎮火して当方に被害はなかったが、なんといっていいのかわからない年始。これ以上は勘弁してほしいものだ。
後期が始まってバタバタ忙しい時期を乗り越えて、学園祭の連休をあてにして家族旅行などを計画していたのに、子供が2人ともインフルエンザにかかってしまって旅はキャンセル... おまけに夫婦そろってインフルエンザをもらってしまって一家全滅。インフルエンザに臥せった学園祭(連休)と最悪であった。私はいまだに後遺症らしき気管支炎+鼻腔炎が治まらない。年を取ったせいか、風邪とかの後に慢性的にこんな症状が出るようになった。結構つらい。
仕事も落ち着いたので、勢いでデータのバックアップだけ取ってアップグレードしました。とりあえずウェブサーバー(Apache)関係は動いている模様。あとメールサーバー(Exim)とファイルサーバー(Samba)はとり急いでチェックしないと。その他はおいおいで...
このサーバーは 2TB の HDD 2台を使った RAID1(同じデータを複数の HDD に記録するミラー)で運用しているのだが、アップグレード後の動作チェックをしていたら、片方の HDD の SMART にエラーが出ていた...
This message was generated by the smartd daemon running on: host name: maa DNS domain: u.icc.ac.jp The following warning/error was logged by the smartd daemon: Device: /dev/sdb [SAT], failed to read SMART Attribute Data Device info: WDC WD20EFRX-68EUZN0, S/N:WD-WCC4M6LV57DV, WWN:5-0014ee-2b987b2ce, FW:82.00A82, 2.00 TB
さらにそのせいで RAID デバイスにも致命的なエラーが出てリビルドが開始されていた...
This is an automatically generated mail message from mdadm running on maa A DegradedArray event had been detected on md device /dev/md/0. Faithfully yours, etc. P.S. The /proc/mdstat file currently contains the following: Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] md0 : active raid1 sdb1[2] sda1[1] 1953382400 blocks super 1.2 [2/1] [_U] [>....................] recovery = 0.1% (2955648/1953382400) finish=512.2min speed=63456K/sec bitmap: 5/15 pages [20KB], 65536KB chunk unused devices: <none>
なんてこった、こんなタイミングで HDD の寿命が尽きようとしているなんて、取り急ぎ Amazon で同じものを探してポチったのだが、なんか研究室のどこかにありそうな気がして探してみると、古い PC の中から出てきた。急いで注文をキャンセルしてさっさと交換に取り掛かった。RAID デバイスの HDD を交換するのは確か2度目だろうか。
異常のある HDD を慎重に確かめて(正常な方を取り外したらシャレにならない)交換し、正常な HDD とまったく同じようにパーティションを切って、RAID デバイス(/dev/md0)に追加するとリビルドが始まった。完了には時間がかかるので、ここで研究室を閉めて帰宅した。
帰宅後、お風呂とご飯を済ませ、進捗状況を確認すると 21:40 の時点で 66.4%
md0 : active raid1 sdb1[2] sda1[1] 1953382400 blocks super 1.2 [2/1] [_U] [=============>.......] recovery = 66.4% (1297145664/1953382400) finish=107.5min speed=101644K/sec bitmap: 3/15 pages [12KB], 65536KB chunk
最後の仕上げのブートローダー(grub)の書き込みは明日の朝だな。
8月に入ってもまだ試験期間とか、昔は考えられなかったほど夏休みが遠くなった。試験が終わったら採点と成績評価をしなければならないし、来年度科目の担当者決め等の学務の仕事の締め切りも 8/7 だったりするし、オープンキャンパスとかで土曜日はつぶれるし、他の入試の仕事も8月中には片づけないとだし、はっきりいって8月中は仕事(研究以外の業務)がある。ありえない。