Chapter 3. 文字コード

Linux の日本語ロケールで使用する文字コードとして「日本語 EUC」を推奨 する。Linux における日本語 EUC の構成は以下の通りとする。

ISO/IEC 2022:1994 の符号化方式で暗黙のうちに

 G0 ISO 646 IRV (ISO 646 の国際基準版)
 G1 JIS X 0208-1990 (JIS 漢字)
 G2 JIS X 0201-1976 のカタカナ部分 (俗称 半角カナ)
 G3 JIS X 0212-1990 (JIS 補助漢字)

が指示されており、GL に G0 が、GR に G1 が呼び出されているものとする。 G2 および G3 の文字コードの使用にはそれぞれ SS2 および SS3 のみを使 用する。ここで SS2 および SS3 には 08/14 および 08/15 のみを使用する こととし、続く文字コードには最上位ビットに 1 が立っているものを使用 する。

指針として G2 および G3 に配した文字コードは他の環境との互換のための みに使用し、できる限り使用しないことが望ましい。将来の変更においてこ の位置に別の文字集合を割り当てる場合もありえる。

G0 は JIS X 0201 ではなく ISO 646 IRV であることに注意すること。他の 環境との互換のためにやむをえない場合を除いては、JIS X 0201 の円記号 およびオーバーラインは利用しないことを推奨する。

各文字集合の未割当部分は全て将来の拡張のために予約されている。未割当 部分をユーザ定義文字(いわゆる外字)用として使用してはならない。

補足: この文字コードの定義は「日本語 EUC」以外の文字コードの利用を禁止 するものではない。ユーザの設定により他の文字コードに切り換えるこ とができた方が望ましい。あくまでも利便性のために、「文字コードと して少なくとも日本語 EUC が利用できること」 「デフォルトを日本語 EUC にすること」を推奨するものである。また他の環境との互換性のた め外字を必要とする場合には ja_JP.eucJP ではなく別の名前を使用す ることが望ましい。