Linux Kernel 2.4 Documentation: /usr/src/linux/Documentation/unicode.txt
unicode.txt

Unicode に対応するための Linux カーネルコード変更点についての説明 [プレインテキスト版]
原著作者: H. Peter Anvin <hpa@zytor.com>
翻訳者: 山縣敦 <ayamagat@phys.metro-u.ac.jp>
バージョン: 2.4.0
翻訳日時: 1999/01/29


文字をフォントにマップする Unicode を使うために Linux のカーネル・コー
ドは書き直されました．ただひとつの Unicode-to-font テーブルをダウンロー
ドすれば，表示されたフォントを使うように 8 ビット文字セットと UTF-8 モー
ドとの両方が変更されます．

これにより 8 ビット文字テーブルの意味がわずかに変わります．現在の 4 つ
の文字テーブル:

マップ記号	マップ名			エスケープ・コード (G0)

LAT1_MAP	Latin-1 (ISO 8859-1)		ESC ( B
GRAF_MAP	DEC VT100 pseudographics	ESC ( 0
IBMPC_MAP	IBM code page 437		ESC ( U
USER_MAP	User defined			ESC ( K

フォントは IBM 文字セットと完全に異なっているかもしれないので，特に 
ESC ( U はもう "straight to font" でありません．例えば Latin-1 フォン
トがロードされてもブロック・グラフィックスが使用できます．

Unicode standard/ISO 10646 に従って，U+F000 から U+F8FF の範囲が OS に
広く割り当てるために予約されました．(Unicode Standard は「Corporate
Zone」と呼びます．Linux には誤りなので「Linux Zone」と呼びます．)直接
マッピング・エリアは 2 の大きな巾で始まるので，(万一 1024 あるいは 
2048 文字フォントが必要になる場合に備えて) U+F000 が出発点に選ばれまし
た．これで U+E000 から U+EFFF が End User Zone として残ります．

U+F000 から U+F1FF の範囲の Unicode はロードされたフォントに，変換テー
ブルを回避して直接マップするためにハード・コードされました．以前の動作
をエミュレートするために，ユーザー定義のマップは現在 U+F000 から 
U+F1FF がデフォルトです．将来にこの範囲が拡張されるのは保証されるべき
です．

Linux Zone に割り当てられた現行の文字
-------------------------------------

加えて，Unicode 1.1.4 に存在しない(，少なくとも私は見つけたことのない，)
以下の文字が定義されました．これらは DEC VT グラフィックス・マップで使
われます:

U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1
U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9

6x10 文字行列が DEC VT220 で使われます．これらの文字は DEC VT グラフィッ
クス・文字セットの無理のない拡張です．SCAN 5 の行はブロック・グラフィッ
クス文字としても使われるので省略しました．ですから U+2500 FORMS LIGHT
HORIZONTAL としてコードしました．しかし U+F802 は必要になるでしょうか
ら空白にしておきました．

クリンゴン語のサポート
----------------------

多くの虚構の言語を含めることが提案された場合の潜在的なコード・ポイント
の急増を恐らく心配して，あいにく Unicode/ISO 10646 はクリンゴン語のた
めのコード・ポイントを割り当てていません．政治的理由もあります．(例え
ば，日本語は第一に全体の 16 ビットの概念にとって，あまり喜ばしくありま
せん．)しかし，ハッカーの操る Linux OS でサポートするのは，価値ある立
派な言語学ハックと思われます．ゆえに Linux Zone のリストにそれを加える
ことを私は選択しました．

クリンゴン・アルファベットのためのいくつかのグリフ形が提案されました．
しかし，記号のセットは，実際の形が異なるだけで，全体を通して矛盾のない
ように思われるので，標準の Unicode の慣例を保ちつつこれらの違いはフォ
ントの異形とみなされます．

クリンゴン語には 26 文字のアルファベットと 10 個の数字で順番を書き表す
方法があり，左から右へ，上から下へ，書かれます．句読法はラテン語字訳に
使われるだけに思われます．おのおのの文を 1 行に書いて中心をそろえるの
が通例です．空白は句読のために取っておき，確認の必要があります．

このエンコーディングは Klingon Language Institute によって是認されまし
た．詳細はそちらに問い合わせてください:

	http://www.kli.org/

Linux CZ の始めの文字は，飾り文字，記号，形態のタイプの大部分になりま
したし，これは言語なので，標準の Unicode の慣例を守って 16 セル境界の
終りに私はそれを配置しました．

U+F8D0	KLINGON LETTER A
U+F8D1	KLINGON LETTER B
U+F8D2	KLINGON LETTER CH
U+F8D3	KLINGON LETTER D
U+F8D4	KLINGON LETTER E
U+F8D5	KLINGON LETTER GH
U+F8D6	KLINGON LETTER H
U+F8D7	KLINGON LETTER I
U+F8D8	KLINGON LETTER J
U+F8D9	KLINGON LETTER L
U+F8DA	KLINGON LETTER M
U+F8DB	KLINGON LETTER N
U+F8DC	KLINGON LETTER NG
U+F8DD	KLINGON LETTER O
U+F8DE	KLINGON LETTER P
U+F8DF	KLINGON LETTER Q
	- Written <q> in standard Okrand Latin transliteration
U+F8E0	KLINGON LETTER QH
	- Written <Q> in standard Okrand Latin transliteration
U+F8E1	KLINGON LETTER R
U+F8E2	KLINGON LETTER S
U+F8E3	KLINGON LETTER T
U+F8E4	KLINGON LETTER TLH
U+F8E5	KLINGON LETTER U
U+F8E6	KLINGON LETTER V
U+F8E7	KLINGON LETTER W
U+F8E8	KLINGON LETTER Y
U+F8E9	KLINGON LETTER GLOTTAL STOP

U+F8F0	KLINGON DIGIT ZERO
U+F8F1	KLINGON DIGIT ONE
U+F8F2	KLINGON DIGIT TWO
U+F8F3	KLINGON DIGIT THREE
U+F8F4	KLINGON DIGIT FOUR
U+F8F5	KLINGON DIGIT FIVE
U+F8F6	KLINGON DIGIT SIX
U+F8F7	KLINGON DIGIT SEVEN
U+F8F8	KLINGON DIGIT EIGHT
U+F8F9	KLINGON DIGIT NINE

他の虚構的人工的書体
--------------------

クリンゴン Linux Unicode ブロックの割り当て，虚構的人工的書体の登録は 
John Cowan <cowan@ccil.org> 氏によって創設されました．ConScript
Unicode Registry は http://locke.ccil.org/~cowan/csur/ でアクセスでき
ます．使用される範囲は End User Zone の後部なので，規範に従って割り当
てることができません．しかし，虚構的な書体のエンコードを望む方々が，内
部使用可能なことに興味を持ってこれらのコードを使用することを推奨します．
クリンゴン語に対して CSUR は Linux エンコーディングを採用しました．

	H. Peter Anvin <hpa@zytor.com>

訳者: 山縣 敦 <ayamagat@phys.metro-u.ac.jp>
Linux カーネル 2.4 付属文書一覧へ戻る
JF Project メインページへ
JF Project 全般に関わるご意見ご要望は jf@listserv.linux.or.jp までお願いします.