JF Linux Kernel 2.2 Documentation: /usr/src/linux/Documentation/IO-APIC.txt

IO-APIC.txt

Intel の SMP ボードにおける IO-APIC について [プレインテキスト版]


ほとんど(すべての)インテル SMP ボードはいわゆる「IO-APIC」を持って
います。IO-APIC とは拡張された割り込みコントローラで、ハードウェア
割り込みを複数の CPU や CPU のグループに配送することができます。

Linux は IO-APIC をサポートしますが、残念なことに壊れたボードがあって
IO-APICを無条件に有効にするのは安全ではありません。
従って 100 パーセント安全である時だけ IO-APIC を有効にするというのが
Linux のポリシーです。すなわち、

	       - ボードが「ホワイトリスト」に載っていること

	または - IO-APIC に接続された PCI のピンがボードにないこと

	または - ユーザが pirq= ブートオプション行を使ってブラック
	         リストにある設定を無効にしていること

です。カーネルメッセージによって、ボードが「安全」であるかどうかを知る
ことができます。もしコンピュータが有効な IO-APIC IRQ とともに起動すれば
何もしなくて結構です。あなたの /proc/interrupts はこんなふうになっている
でしょう。

   ---------------------------->
   hell:~> cat /proc/interrupts
              CPU0       CPU1
     0:      90782          0   XT PIC   timer
     1:       4135       2375  IO-APIC   keyboard
     2:          0          0   XT PIC   cascade
     3:        851        807  IO-APIC   serial
     9:          6         22  IO-APIC   ncr53c8xx
    11:        307        154  IO-APIC   NE2000
    13:          4          0   XT PIC   fpu
    14:      56000      30610  IO-APIC   ide0
   NMI:          0
   IPI:          0
   <----------------------------

いくつかの割り込みは「XT PIC」のままですが、これは問題ではありません。
それらの IRQ ソースは「重く」ないのです。

ブートメッセージに「unlisted/blacklisted board, DISABLINGIO-APIC IRQs」
と出たら、マルチ CPU IO-APIC IRQ を得るために次のことをしなければなり
ません。

	A) もしボードがリストにない物だったら、linux-smp へメールして
	   ホワイトリストかブラックリストのどちらかに入れてもらって下さい。
	B) もしボードがブラックリストにある物だったら、システムがブート
	   する適切な pirq= オプションを見つけて下さい。

pirq= 行は /etc/lilo.conf にあって、次のようなものです。

	append="pirq=15,11,10"

実際の数字は使っているシステム、PCI カード、PCI スロットの場所に依存しま
す。
通常 PCI スロットは、PCI チップセットの IRQ ルーティング機構 (PIRQ1-4 入
力線)
に入る前に「デイジーチェーン接続」になっています。

               ,-.        ,-.        ,-.        ,-.        ,-.
     PIRQ4 ----| |-.    ,-| |-.    ,-| |-.    ,-| |--------| |
               |S|  \  /  |S|  \  /  |S|  \  /  |S|        |S|
     PIRQ3 ----|l|-. `/---|l|-. `/---|l|-. `/---|l|--------|l|
               |o|  \/    |o|  \/    |o|  \/    |o|        |o|
     PIRQ2 ----|t|-./`----|t|-./`----|t|-./`----|t|--------|t|
               |1| /\     |2| /\     |3| /\     |4|        |5|
     PIRQ1 ----| |-  `----| |-  `----| |-  `----| |--------| |
               `-'        `-'        `-'        `-'        `-'

それぞれの PCI カードは PCI IRQ (INTA,INTB,INTC,INTD)を出します。

                               ,-.
                         INTD--| |
                               |S|
                         INTC--|l|
                               |o|
                         INTB--|t|
                               |x|
                         INTA--| |
                               `-'

これら INTA から INTD の PCI IRQ は常に「カードに対してローカル」です。
その本当の意味はカードがどのスロットにあるかに依存します。デイジーチェー
ンの
図を見れば、スロット 4 のカードが INTA IRQ を発行したとすると、それは
PCI
チップセットにとっては PIRQ2 信号となります。
(訳注:この説明あってますか?)
たいていのカードは INTA を発行するので、PIRQ 線は有効に分散されます
(IRQ ソースを適当に分散させるのは必須ではなく PCI IRQ は自由に共有でき
ますが、割り込みが共有されていないほうがパフォーマンスがよくなります)。
スロット 5 は必ずビデオカードに使われますが、普通ビデオカードは割り込み
を使わないのでデイジーチェーン接続になっていません。

したがってもし SCSI カード (IRQ11) をスロット 1 にさし、Tulip カード
(IRQ9) をスロット 2 にさしたとすると、pirq= 行には、

	append="pirq=11,9"

と設定することになります。
次のスクリプトはそのようなデフォルトの pirq= 行を PCI の設定状況から
得るためのものです。

	echo -n pirq=; echo `scanpci | grep T_L | cut -c56-` | sed 's/ /,/g'

このスクリプトは、空きスロットがあったりボードがデフォルトのデイジーチェ
ーン
接続になっていない時 (または IO-APIC が何か変なふうに PIRQ ピンに接続さ
れて
いる時)にはうまく動作しませんので気をつけて下さい。
例えば上の場合で SCSI カード (IRQ11) をスロット 3 にさし、スロット 1 が
空いているとすると次のようにします。

	append="pirq=0,9,11"

[ 「0」 は「プレースホルダ」といって空の (あるいはIRQ を出さない) スロッ
ト
のために予約された値です。]

一般的にすべての IRQ 番号をきちんと並べ変えれば正しい pirq= の設定を
見つけることはできますが…、すこし時間がかかります。
「正しくない」 pirq 行は、ブートプロセスがハングしたり(例えばモジュール
と
して挿されていれば)デバイスがきちんと動作しない原因になります。

もし PCI バスが 2 つある時には、8 つまでの pirq 値を使うことができます
が、
そのようなボードはたいていちゃんとした設定になっているので、ホワイト
リストに含まれることでしょう。

もしかしたら次のようなちょっと変わった pirq 行が必要になるかもしれませ
ん。

	append="pirq=0,0,0,0,0,0,9,11"

うまくトライアンドエラーの技術を使って、正しい pirq 行を見つけ
ましょう…


次の pirq 行は、ボードを無理矢理ホワイトリストに入れるために使えます。

	append="pirq=0"

[ もしこれをやって問題なくシステムが動いたら、正式なホワイトリストに加え
な
ければいけませんので連絡して下さい。]

幸運を祈ります。もし何かこのドキュメントに書いていない問題があれば
linux-smp@vger.rutgers.edu または linux-kernel@vger.rutgers.edu に
メールして下さい。

-- mingo

日本語訳:林(hayashi884@geocities.co.jp) 1999.5.8(Ver.0.1)
-------------------------------------------------------
(以下原文)
Most (all) Intel SMP boards have the so-called 'IO-APIC', which is
an enhanced interrupt controller, able to route hardware interrupts
to multiple CPUs, or to CPU groups.

Linux supports the IO-APIC, but unfortunately there are broken boards
out there which make it unsafe to enable the IO-APIC unconditionally.
The Linux policy thus is to enable the IO-APIC only if it's 100% safe,
ie.:

	   - the board is on the 'whitelist'

	or - the board does not have PCI pins connected to the IO-APIC

	or - the user has overridden blacklisted settings with the
	     pirq= boot option line.

Kernel messages tell you whether the board is 'safe'. If your box
boots with enabled IO-APIC IRQs, then you have nothing else to do. Your
/proc/interrupts will look like this one:

   ---------------------------->
   hell:~> cat /proc/interrupts
              CPU0       CPU1
     0:      90782          0   XT PIC   timer
     1:       4135       2375  IO-APIC   keyboard
     2:          0          0   XT PIC   cascade
     3:        851        807  IO-APIC   serial
     9:          6         22  IO-APIC   ncr53c8xx
    11:        307        154  IO-APIC   NE2000
    13:          4          0   XT PIC   fpu
    14:      56000      30610  IO-APIC   ide0
   NMI:          0
   IPI:          0
   <----------------------------

some interrupts will still be 'XT PIC', but this is not a problem, none
of those IRQ sources is 'heavy'.

If one of your boot messages says 'unlisted/blacklisted board, DISABLING
IO-APIC IRQs', then you should do this to get multi-CPU IO-APIC IRQs
running:

	A) if your board is unlisted, then mail to linux-smp to get
	   it into either the white or the blacklist
	B) if your board is blacklisted, then figure out the appropriate
	   pirq= option to get your system to boot


pirq= lines look like the following in /etc/lilo.conf:

	append="pirq=15,11,10"

the actual numbers depend on your system, on your PCI cards and on their
PCI slot position. Usually PCI slots are 'daisy chained' before they are
connected to the PCI chipset IRQ routing facility (the incoming PIRQ1-4
lines):

               ,-.        ,-.        ,-.        ,-.        ,-.
     PIRQ4 ----| |-.    ,-| |-.    ,-| |-.    ,-| |--------| |
               |S|  \  /  |S|  \  /  |S|  \  /  |S|        |S|
     PIRQ3 ----|l|-. `/---|l|-. `/---|l|-. `/---|l|--------|l|
               |o|  \/    |o|  \/    |o|  \/    |o|        |o|
     PIRQ2 ----|t|-./`----|t|-./`----|t|-./`----|t|--------|t|
               |1| /\     |2| /\     |3| /\     |4|        |5|
     PIRQ1 ----| |-  `----| |-  `----| |-  `----| |--------| |
               `-'        `-'        `-'        `-'        `-'

every PCI card emits a PCI IRQ, which can be INTA,INTB,INTC,INTD:

                               ,-.
                         INTD--| |
                               |S|
                         INTC--|l|
                               |o|
                         INTB--|t|
                               |x|
                         INTA--| |
                               `-'

These INTA-D PCI IRQs are always 'local to the card', their real meaning
depends on which slot they are in. If you look at the daisy chaining
diagram,
a card in slot4, issuing INTA IRQ, it will end up as a signal on PIRQ2
of
the PCI chipset. Most cards issue INTA, this creates optimal
distribution
between the PIRQ lines. (distributing IRQ sources properly is not a
necessity, PCI IRQs can be shared at will, but it's a good for
performance
to have non shared interrupts). Slot5 should be used for videocards,
they
do not use interrupts normally, thus they are not daisy chained either.

so if you have your SCSI card (IRQ11) in Slot1, Tulip card (IRQ9) in
Slot2, then you'll have to specify this pirq= line:

	append="pirq=11,9"

the following script tries to figure out such a default pirq= line from
your PCI configuration:

	echo -n pirq=; echo `scanpci | grep T_L | cut -c56-` | sed 's/ /,/g'

note that this script wont work if you have skipped a few slots or if
your
board does not do default daisy-chaining. (or the IO-APIC has the PIRQ
pins
connected in some strange way). E.g. if in the above case you have your
SCSI
card (IRQ11) in Slot3, and have Slot1 empty:

	append="pirq=0,9,11"

[value '0' is a generic 'placeholder', reserved for empty (or non-IRQ
emitting)
slots.]

generally, it's always possible to find out the correct pirq= settings,
just
permute all IRQ numbers properly ... it will take some time though. An
'incorrect' pirq line will cause the booting process to hang, or a
device
won't function properly (if it's inserted as eg. a module).

If you have 2 PCI buses, then you can use up to 8 pirq values. Although
such
boards tend to have a good configuration and will be included in the
whitelist.

Be prepared that it might happen that you need some strange pirq line:

	append="pirq=0,0,0,0,0,0,9,11"

use smart try-and-err techniques to find out the correct pirq line ...


the following pirq line can be used to force a board into the whitelist:

	append="pirq=0"

[if your system works with no problems after this, then it should be
added
to the official whitelist, contact us]

good luck and mail to linux-smp@vger.rutgers.edu or
linux-kernel@vger.rutgers.edu if you have any problems that are not
covered
by this document.

-- mingo

Linux カーネル 2.2 付属文書一覧へ戻る