(C)1995,1996 NCALS
characters
NCALSでは,日本語文書ファイルを共通にするために,文字
符号に関するNCALS規約を制定した。
この文書型定義で処理する対象のSGML文書は,その規約に
適合していなければならない。
文字符号の概要は,次の1.~3.のとおりである。
1.使用中の符号表の図形左側は,ISO/IEC 646(IRV=ASCII)
の英数字記号とする(JIS X 0201ではない。)。
2.使用中の符号表の図形右側は,JIS X 0208(情報交換用
漢字符号)から次の文字を削除したもの。
a)ASCIIと同じ文字概念の文字
例:A-Z,a-z,0-9,間隔など。
ただし,"'","""及び" ̄"を除く。
3.JIS X 0212(情報交換用漢字符号-補助漢字)は,SS3によって
1文字を図形左側へ呼び出す(3バイトに注目)。
参考 1.個人計算機及び一部のUNIX機など内部符号として
"shiftjis"を使用している場合,
a)入出力(例:けん盤,表示装置)の前後で符号変換し,
更に対象文書をファイルから読み込みしたとき,すべ
ての図形文字を2バイト表現することを推奨している。
b)3.を適用する。
2.UNIX機のうち,内部符号がEUC(拡張UNIX符号)の場合,
a)行末機能符号がLFの他にCRを使う。
b)3.を適用する。
3.すべての文書の入力編集系は,次の要件を保証すること
を期待している。
a)標準外文字(俗語:外字)を入力できないようにする。
b)1バイト片仮名文字を入力できないようにする又は
2バイト片仮名文字符号へ変換する。
c)2バイト英数字を入力できないようにする又は1バイト
英数字符号へ変換する。
符号の詳細は,文字符号に関するNCALS規約及びSGML宣言例を参照されたい。