The code extension technique applied in the document is based on ISO/IEC 2022.
This is same JIS X 0202(Code extension technique for information interchange).
The following escape sequence is assumed;
ESC 02/5 04/0
where 04/0 : identifier of ISO/IEC 646.
The following escape sequences are assumed;
ESC 02/6 04/0 ESC 02/4 02/9 04/2
where ESC 02/06 04/0 : identifier for 1997 version of JIS 0208 code table,
ESC 02/4 02/9 04/2 : designate the multibyte(02/4) code JIS X 0208(04/2) into G1 set(02/9).
Note: This code can be presented by Extended Unix Code(EUC) as a part of this code system. The difference among three coding techniques is as shown in the following table.
================================================================ Type of code JIS(G1)technique ISO-2022-JP EUC ---------------------------------------------------------------- ASCII G0 set G0 set G0 set JIS Kanji G1 set G0 set G1 set JIS katanaka none none G2 set JIS Hojyo-Kanji (G3 set)if req none none User defined none none G3 set =================================================================Where :
参考:ISO/IEC 2022による符号拡張方法がHTML及びその母体となったSGMLで使えないことを解説しておきます。
SGMLのSGML宣言が符号値を宣言して使うことになっており,符号
種別がCHARSETの値として文字列によって記述されることに気づいた
SGMLのJIS原案作成委員会主査若鳥らは,SC18/WG8のCharles Goldfarb
らに,ISO/IEC 2022によって宣言すればDESCSETでUNUSEDをわざわざ
宣言しなくてもよいように交渉した。
しかし,この交渉は失敗に終わり,その結果,JIS X 4151では表9
を追加して符号の値及び不使用領域を日本国内に周知させた。
SGMLは,人の目に見える図形文字を主体にして,可搬性を出す記述
言語である。したがって,エスケ-プシケンスが文面に混入しては,
意図に反するという性質を持つ。よって,ISO/IEC 2022とは,折り
合いが悪い。
SGMLでは,もし通信途上だけの符号指定であれば,ISO/IEC 9069
(SDIF)に従って変換して,転送できるように準備してある。しかし,
ISO/IEC 9069(SDIF)の転送構文は,ビット透過様相でなければなら
ないので,当面のInternetでは使いずらいという事情もある。
それどころか,ISO/IEC 2022は難しくて分からないと主張する人の
方が多かった。これは,主要委員が米国でASCIIだけしか見ていない
状態にあったことに起因する。
更に悪いことには,日本人(ほんとの国籍は知らない)に個人計算
機(PC)で使われていたシフトジス符号による取扱いを主眼にする人達
がいたため,PCもUNIXも共通文書にするのだという理想形になって
こなかった。
文書の符号は,本来,処理,通信及び格納の段階で共通であるのが
理想である。ASCIIでの処理をみると,これらの間で共通になって
いることに気付く。日本国でも共通でなければならないものなの
である。
NCALS/WG3/SWG31 & SWG32では, このような点を将来改善するために,
NCALS規格案を作成し,処理対象の文書(文面,絵,写真,設計図など)
の日本語文字符号を,機械,操作系, 応用系などに統一することを提案
している。