The Unix and Internet Fundamentals HOWTO
Prev		Next

8. コンピュータはどうやって複数のプロセスが干渉しあわないようにしているのか?

カーネルのスケジューラは、プロセスの時間的な割り振りを担当しています。同時に、オペレーティングシステムは、プロセスを空間的にも割り振って、それらが互いの作業メモリ領域に干渉しないようにしなければなりません。すべてのプログラムが協調して動いてくれると仮定した場合でも、そのどれかひとつにバグがあり、それによって他のプログラムのメモリ領域が破壊されてしまうような事態は望ましくありません。この問題を解決するために、オペレーティングシステムが行う対処方法は、メモリ管理 (memory management) と呼ばれています。

コンピュータ内の個々のプロセスには、そのコードを実行したり、変数を保存したり、処理の結果を格納したりする場所として、独自のメモリ領域が必要です。こうしたメモリ領域は、(プロセスの命令が保持される)読み出し専用領域である コードセグメント (code segment) と、(プロセスのすべての変数が保持される) 書き込み可能な領域である データセグメント (data segment) から構成されていると考えることができます。データセグメントは、文字どおり個々のプロセスに固有の領域ですが、二つのプロセスが同一のコードを実行している場合、Unix は、メモリの利用効率の観点から、そうしたプロセスが、単一のコードセグメントを共有するよう調整を行います。

8.1. 仮想メモリ：簡易バージョン

メモリは値段が高いので、効率よく利用することが大切です。ときには、マシンで実行中のすべてのプログラム全体をメモリに保持するだけの余裕がない場合が生じます。特に、X サーバのような巨大なプログラムを実行しているような場合には、メモリ不足が生じることがあります。この問題に対処するために、 Unix は、仮想メモリ (virtual memory) と呼ばれるテクニックを使います。これは、プロセスのすべてのコードとデータをメモリ内に保持しようとするものではありません。むしろ、比較的少量の ワーキングセット (working set) だけを保持するようにして、残りのプロセス状態は、ハードディスク上の スワップスペース (swap space) という特別な領域に置いておきます。

注意して欲しいのは、前の段落で「ときには....生じます」と書いた部分は、過去においては、「ほとんどいつも生じていました」と言い換えることができるという点です。以前は、実行中のプログラムのサイズと比べてメモリのサイズが全然足りなかったので、スワッピングは頻繁に起こっていました。しかし、メモリは今日ではかなり安価になっていて、ローエンドのマシンにすら、かなりのメモリが積まれるようになっています。64 MB 以上のメモリを積んだ現在の個人用マシンの場合、X やよく利用するジョブが最初からコアにロードされたあとでも、そうしたプロセスをスワッピングなしで実行することが可能になっています。

8.2. 仮想メモリ：詳細バージョン

前章では、実際にちょっと話を単純化しすぎてしまいました。確かに、プログラムはメモリを、巨大で平板なアドレス領域であり物理メモリよりも大きなものである、と認識していて、その幻想を支えるものとしてディスクスワッピングが利用されているというのは本当です。しかし、現実には、ハードウェアは異なる五種類ものメモリを持っていて、プログラムが最高速度で実行されるようチューニングしなければならない場合は、この五種類のメモリ間での違いは、非常に重要な問題となるのです。マシン内で何が起こっているのかを本当に理解するためには、これら全体がどういう仕組みで動いているのかを知らなければなりません。

五種類のメモリとは、次のようなものです：プロセッサのレジスタ、内部(もしくは、オン・チップ)キャッシュ、外部(もしくは、オフ・チップ)キャッシュ、メインメモリ、およびディスクです。これだけの種類のメモリが存在することの理由は、単純です。スピードを上げるにはお金がかかるからです。上記五種類のメモリは、アクセス時間の短い順番、コストの高い順番に並んでいます。レジスタメモリは、最速かつ最も高価なものであり、一秒間に十億回くらいランダムアクセスが可能ですが、ディスクは最も低速かつ安価であり、一秒間に百回くらいのアクセスしかできません。

以下に、2000年初頭の典型的なデスクトップマシンにおける各種メモリのスピードの一覧表を記載します。スピードと容量は年々上昇し、価格は下がっていきますが、メモリ間でのそれらの比例関係は非常に安定していると考えることができます。メモリが階層構造を持つのは、そうした比例関係が一定であるからです。

ディスク: Size: 13000MB Accesses: 100KB/sec
メインメモリ: Size: 256MB Accesses: 100M/sec
外部キャッシュ: Size: 512KB Accesses: 250M/sec
内部キャッシュ: Size: 32KB Accesses: 500M/sec
プロセッサ: Size: 28 bytes Accesses: 1000M/sec

最速のメモリだけを使ってすべてを構築することはできません。あまりに高価なものになりすぎるからです。仮に高価でなかったとしても、高速なメモリは揮発性です。つまり、電源を切ると、せっかくの成果が失われてしまいます。したがって、コンピュータはハードディスクやその他の非揮発性のストレージを内蔵して、電源を切った際にもデータを保持できるようにしなければなりません。また、プロセッサの速度とディスクの速度との間には、あまりに大きな違いがあります。その中間にある三つのレベルのメモリ階層 (内部キャッシュ (internal cache)、 外部キャッシュ (external cache) およびメインメモリ) は、基本的に、両者のギャップを埋めるために存在しています。

Linux とその他の Unix には、仮想メモリと呼ばれる機能が備わっています。仮想メモリとは、オペレーティングシステムが実際に搭載しているメインメモリ以上のメモリを持っているかのように振舞うということを意味しています。実際の物理メインメモリは、より大きな「仮想」メモリ空間の窓、もしくはキャッシュのように振る舞い、仮想メモリの大部分は実際にはスワップエリアと呼ばれるディスク上の領域に保持されます。ユーザプログラムからは見えないところで、OS は、データブロックをメモリとディスクの間で移動させ、この幻想を維持しています。その結果、仮想メモリは、実メモリよりもずっと大きいが、それほど遅くはないメモリとして機能するわけです。

仮想メモリが物理メモリと比べてどの程度低速になるかというのは、オペレーティングシステムのスワッピングアルゴリズムが、どれだけプログラムによる仮想メモリの利用方法に適合したものになっているかということで決まります。幸なことに、一定の時間間隔で見ると、メモリの読み出しと書き込みは間を置かずになされることが多いため、場所的に見た場合でも、メモリの読み書きはメモリ空間内の特定の場所に集中するという傾向があります。この傾向は、ローカリティ (locality) 、もしくはより正式には リファレンスのローカリティ (locality of reference) と呼ばれています。これは都合のいいことです。メモリへの参照 (reference) が仮想メモリ空間内の様々な場所にランダムに行われるなら、通常は、新しい参照のたびごとにディスクに対する読み出しや書き込みが行われなければならず、仮想メモリはディスクと同じくらい低速になってしまうでしょう。しかし、プログラムというのは一定の場所で読み書きを行うという強い傾向 (locality) を示すものなので、メモリへの参照がある場合でも、オペレーティングシステムはスワップを行うことが比較的すくなくて済みます。

これは、経験則なのですが、最大公約数的にみて最も効率のよいメモリ利用パターンというのは非常にシンプルなものです。その方法は、LRU もしくは最長時間未使用アルゴリズム ("least recently used" algorithm) と呼ばれています。仮想メモリシステムは、必要に応じて、ディスクブロックをメモリの ワーキングセット (working set) として取り込みます。ワーキングセット用の物理メモリが足りなくなったら、最長時間未使用のブロックをディスクに書き出してしまいます。すべての Unix や、仮想メモリを使うその他のオペレーティングシステムの大部分は、この LRU にいくらかの変更を加えたアルゴリズムを使っています。

仮想メモリは、ディスクとプロセッサのスピードの違いを調整する第一の連環となっています。これは、OS が明示的に管理しています。しかし、物理メモリのスピードと、プロセッサがそのレジスタメモリにアクセスするスピードとの間には、まだ大きなギャップがあります。外部と内部のキャッシュは、これを埋めるものであり、そのために上記で述べた仮想メモリとよく似たテクニックを使っています。

物理メインメモリがディスクスワップ領域に対する一連の窓やキャッシュのように振る舞っているように、外部キャッシュもメインメモリに対する窓のように振る舞います。外部キャッシュは、高速 (100M よりも速い秒間 250M アクセス)で、容量の小さいメモリです。ハードウェア (特に、コンピュータのメモリコントローラ) は、LRU の方法を使って、メインメモリから取ってきた一連のデータをもとにして、外部キャッシュ内のデータを管理します。歴史的な理由で、キャッシュスワッピングの単位は、ページ (page) ではなくライン (line) と呼ばれています。

しかし、これで話が終わったわけではありません。内部キャッシュが、外部キャッシュの一部をさらにキャッシュすることで、アクセス速度の底上げの最終段階を担当しています。この内部キャッシュは、さらに高速で容量の小さいメモリです。事実、これはプロセッサチップのすぐ側に置かれています。

読者がプログラムを本当に速くしたいと思うなら、こうした細かい事柄を知っておくことが有益です。プログラムは、ローカリティが強いほど高速になります。キャッシュがより効果的に働くからです。それゆえ、プログラムを速くする一番簡単な方法は、プログラムを小さくすることです。プログラムが多くのディスク I/O のために動きが鈍くなったり、ネットワークイベントを待ったりしなくてもすむ場合、それは、通常、システム内で許容されている最大のキャッシュ効果をともなったスピードで実行されるはずだからです。

プログラム全体を小さくできない場合は、スピードに関係する部分をチューニングするようにして、強いローカリティを発揮するようにすれば報われるでしょう。そうしたチューニングに関するテクニックの詳細は、この文書の範疇を越えます。読者がそれらを必要とする頃には、コンパイラにかなり精通しているはずなので、そうした方法はおのずと理解できるはずです。

8.3. メモリ管理ユニット (memory management unit)

充分な容量のコアがあり、スワッピングを避けられるときでも、メモリ管理 (memory management) と呼ばれるオペレーティングシステムの一部は、重要な役割を果たしています。確認しておきたいのは、プログラムは自分のデータセグメントしか変更できないということです。すなわち、あるプログラムの中の不具合のあるコードや悪意を持って作られたコードが、他のプログラムのデータセグメントにデータを吐き出すことは出来ない仕組みになっているということです。これを実現するために、メモリ管理機構では、データセグメントとコードセグメントの一覧が書かれたテーブルを保持しています。このテーブルは、プロセスが追加のメモリ領域を要求したり、それまで使っていたメモリ領域を開放する(通常、これはプロセス終了時に起こります)たびに、更新されるようになっています。

オペレーティングシステムのメモリ管理機構は、このテーブルを使って、 MMU もしくは メモリ管理ユニット (memory management unit) と呼ばれる、下位層のハードウェアにある特別な箇所にコマンドを渡しています。現代のプロセッサチップには、複数の MMU が内蔵されています。 MMU は、メモリ領域を保護するための特別な機能を持っているので、越境的なメモリ参照は拒否されるとともに、その際には特殊な割り込みが発生するようになっています。

今までに、"Segmentation fault" や "core dumpd" といったメッセージを見たことがあるなら、まさに、そうした越境的なメモリ参照が起こったということを意味します。実行中のプログラムが自分以外のセグメントにメモリアクセスしようとすると、致命的な割り込みが起きるのです。これは、プログラムにバグがあることを意味しています。MMU が残す core dump は、プログラマがそのバグを追跡するのを支援するための診断情報なのです。

プロセスの相互干渉の防止は、プロセスがアクセスできるメモリ領域を分離すること以外に、さらに別の観点からもなされています。読者は、上記以外にも、ファイルへのアクセス制御が出来るようにして、バグのあるプログラムや悪意を持ってつくられたプログラムがシステムの重要ファイルを破壊できないようにしたいと思うことでしょう。 Unix が、ファイルパーミッションという仕組みを持っているのは、このためです。これについては、後ほど説明します。

Prev	Home	Next
コンピュータはどうやって複数のことを同時に行うのか?		コンピュータは情報をどのようにメモリに保持するのか?