玄箱サーバ死亡



玄箱(初代)のバックアップ機が起動しなくなりました。

玄箱は、我が家(ていうか私の)の中では情報の中核を成しているサーバなわけですが、それ故壊れたらイヤなので、運用機の他にバックアップ機を購入していました。そのバックアップ機では、アップデートをまず試しに実行してみたり、ビルドに何度もrebootしなければならないプログラムを試験的にインストールしたり、またまた大事なファイルを二重化でバックアップしておいたり、と‥‥。バックアップ機も常に電源を入れているワケではないながらも、偶には電源投入して使っていました。

それが、先日久々に電源をいれたところ挙動がおかしい。最初はEMモードから通常モードに復帰する時にtelnetでログインできない事象が起きたけど、何度か電源を入れ直したりしたところログインできるようになった。そのときはあまり気にしていなかったけど、しばらく使ってみて異変が!

kernel panic

そのときはEMモードでなにか不具合が有ったかと思ってrebootしたけど、ほぼそれが最後でした。

コンソールをつなげて起動をリアルタイムに見てみると、原因はすぐわかった。

d0222779_1633568.jpg

d0222779_1636530.jpg


U-BOOTの時点で"Net"(のインタフェース)を認識していない。そのままログインプロンプトは出て一見起動はしているのだけれど、dmesgをみるとエラーだらけ。インタフェースが無いことになっているので、ethernet関係がすべてerrorだから、まともに動くわけもない。当然telnetもできない。

仕方がないのでコンソールで色々確認していたわけだけど、どうもしばらく放っておくとなぜかnetが復活する。しかし、復活したからと言って使っていると、そのうち(数時間)でまた認識しなくなってkernel panicを起こす。なんどやってもその状態。不安定なのでサーバとしては使えない。

どうも放っておくとデバイスとして"Net"が見えることから、電荷が影響していると考えられ、電荷と言えばコンデンサ、コンデンサを使っている部品と言えば電源、と言うことで、最初は電源を疑った。

一応電源の電圧や、玄箱のメインボードテストピンの電圧を測っていたけど、異常なし。とは言っても電圧を測ったところで異常が気づくとも思えない。それで正常に動いている初号機(運用機)を止めて、部品をswapして切り分けをしてみた。

  1. 先ずは正常な電源を、故障機に移植して起動してみる。→NG
  2. 次にメインボードを正常に動いていた玄箱に移植して起動してみる→NG
  3. 最後に故障機に正常なメインボードを移植して起動してみる→OK

というわけで、メインボードの異常であることはわかったけど、メインボードは素人が手を出せるところは無く、もうそれ以上はどうしようもない‥‥。というわけで、このメインボードはお蔵入り。電源とか筐体とかは部品取りとして保管することに。

メインボードが一つしかなくなってしまったため、壊れる前にまたバックアップを手に入れたいところ。ただ、もう玄箱(初代)は中古でも手に入りにくく、更に手に入ったとしてもかなり時間が経っていることから、寿命が短いかもしれない。

それなら、今はやりのRaspberryPiに乗り換えるというのが運用を長続きさせる正しい道かもしれない。残念だけど、今のサーバの終焉の前に、早めに同じ機能をRaspberryPiで構築しなければ‥‥。
[PR]
by tkn384 | 2014-09-23 16:39 | 玄箱


今の好きなことは、暇な時いじる玄箱とか家電とか


by tkn384

プロフィールを見る
画像一覧

カテゴリ

全体
家電
玄箱
電子工作
Raspberry Pi
未分類

以前の記事

2014年 09月
2014年 08月
2014年 07月
2014年 06月
2014年 03月
2013年 08月
2012年 05月
2011年 05月
2011年 04月
2011年 03月
2011年 02月

フォロー中のブログ

メモ帳

最新のトラックバック

ライフログ

検索

タグ

その他のジャンル

ブログパーツ

最新の記事

玄箱サーバ死亡
at 2014-09-23 16:39
初代玄箱USB増設
at 2014-08-31 14:05
RaspberryPiのバッ..
at 2014-07-21 23:31
Windows7とWindo..
at 2014-07-20 12:16
Windows7のPCを買い..
at 2014-07-06 01:48

外部リンク

ファン

記事ランキング

ブログジャンル

ネット・IT技術

画像一覧