あなたの SMP システムは予期せずロックアップしますか?キーボード入力に 応答しない難しい完全なロックアップですか?このようなロックアップのデバッ グ支援を受けたいですか?すべてが "yes" なら、これはきっとあなた向けの 資料です。 Intel SMP ハードウェアには、'watchdog NMI interrupts' の生成を有効にす る機能があります (NMI: Non Maskable Interrupt - システムに他の原因で難 しいロックアップが起きてもこれらは実行されます)。難しいカーネルロック アップのデバッグに利用できます。周期的な NMI 割込みの実行により、カー ネルは CPU のいずれかがロックアップしたかどうか監視でき、ロックアップ したならデバッグメッセージを出力します。'nmi_watchdog=1' ブートパラメー タでブート時に NMI watchdog を有効 (もしくは無効) にできます。以下は適 切な lilo.conf エントリの例です - append="nmi_watchdog=1" ロックアップは次のシナリオです - システムの CPU のいずれかが周期的なロー カルタイマー割込みを 5 秒以上実行しなければ、NMI ハンドラは oops を生 成しプロセスを終了 (kill) します。この controlled crash (およびカーネ ルメッセージの結果) はロックアップのデバッグに利用できます。したがっ て、ロックアップの発生時は常に、5 秒の待ちと、oops が自動的に発生しま す。カーネルがメッセージを出力しない場合、システムはとても深刻にクラッ シュし (例えば、ハードウェア障害)、NMI 割り込みの受入れさえできなくなっ たか、クラッシュがカーネルのメッセージ出力をできなくしたかのいずれかで す。 Linux 2.2.x 向けの NMI watchdog パッチが http://people.redhat.com/mingo/NMI-watchdog-patches/ にあります。 [バグ報告、提案、パッチを気軽に Ingo Molnar <mingo@redhat.com> もしく は Linux SMP メーリングリスト <linux-smp@vger.kernel.org> に送ってく ださい。] ---------------------------------------------------------------------- 日本語訳:野本浩一 <hng@ps.ksky.ne.jp>