(C)1995,1996 NCALS

characters

NCALSでは,日本語文書ファイルを共通にするために,文字
符号に関するNCALS規約を制定した。
この文書型定義で処理する対象のSGML文書は,その規約に
適合していなければならない。

文字符号の概要は,次の1.~3.のとおりである。

1.使用中の符号表の図形左側は,ISO/IEC 646(IRV=ASCII)
  の英数字記号とする(JIS X 0201ではない。)。
2.使用中の符号表の図形右側は,JIS X 0208(情報交換用
 漢字符号)から次の文字を削除したもの。
  a)ASCIIと同じ文字概念の文字
  例:A-Z,a-z,0-9,間隔など。
        ただし,"'","""及び" ̄"を除く。
3.JIS X 0212(情報交換用漢字符号-補助漢字)は,SS3によって
 1文字を図形左側へ呼び出す(3バイトに注目)。

参考 1.個人計算機及び一部のUNIX機など内部符号として
   "shiftjis"を使用している場合,
       a)入出力(例:けん盤,表示装置)の前後で符号変換し,
         更に対象文書をファイルから読み込みしたとき,すべ
         ての図形文字を2バイト表現することを推奨している。
       b)3.を適用する。
     2.UNIX機のうち,内部符号がEUC(拡張UNIX符号)の場合,
       a)行末機能符号がLFの他にCRを使う。
       b)3.を適用する。
     3.すべての文書の入力編集系は,次の要件を保証すること
    を期待している。
       a)標準外文字(俗語:外字)を入力できないようにする。
       b)1バイト片仮名文字を入力できないようにする又は
         2バイト片仮名文字符号へ変換する。
       c)2バイト英数字を入力できないようにする又は1バイト
         英数字符号へ変換する。

符号の詳細は,文字符号に関するNCALS規約及びSGML宣言例を参照されたい。