Copyright (C) 1995 Nihon Unisys,Ltd. Copyright (C) 1998 NCALS

5. 実体構造


実体構造の案内

5.1 SGML文書(式1) 5.2 SGML実体(式2~5) 5.3 データ実体(式5.1~6) SGML規格の案内へ戻る。

5.1 SGML文書

 SGML文書は,物理的には実体を組織した構造体となる。その主体は,SGML文書 実体とする。SGML文書実体には,それに関係する他の実体がSGML文書実体から見 てどこにあるかを示した実体参照を含めることができる。

  SGML文書 = SGML文書実体,        ( SGML部分文書実体 | SGML文実体 | 文字データ実体 |         特定文字データ実体 | 非SGMLデータ実体 )*     ―(1)

 SGML文書実体,SGML部分文書実体及びSGML文実体を,SGML実体という。

備考1. この生成規則は,SGML文書が一つのSGML文書実体と幾つかのその他 の実体とから構成されることを示すだけであって,その文書を収めたデータ 流,メッセージ交換,ファイルシステムなどの物理的な媒体上での構成を規 定するものではない。特に,複数の実体が同一の媒体にあってもよいし,一    つの実体が複数の媒体に分散していてもよい。更に,物理的な順序がどうな っていてもよい。

2. この規格は,SGML実体以外の実体に用いる文字について,何らの要 件を設けない。これらの文字の解釈は,他の規格又は規則によることになる。

  3. SGML文書を,その実体の構造を保った形で単一の媒体上で扱うため のSGML文書交換様式(SDIF)を定めた規格として,ISO 9069がある。

5.2 SGML実体

  SGML文書実体 = s*, SGML宣言,           前書き, 文書実現値集合, Ee         ―(2)   SGML部分文書実体 = 前書き, 文書実現値集合, Ee      ―(3)   SGML文実体 = SGML文字*, Ee ―(4)

 SGML実体は,その文字列をこの規格に従って構文解析して,そのSGML宣言,前書き, 文書実現値集合及びそれらの構成部品を認知する。

 構文解析は,それぞれのSGML文字に対して,出現の順に次の(1)~(4)のとおりに行う。

(1)その文字が区切り子の一部であるかどうかを検査する(8.6参照)。一般区切り子と  認知した場合は,それに続くマークを構文解析する[(4)参照]。短縮参照と認知でき  た場合は,8.4.6による。

(2)区切り子の一部でもなく短縮参照でもなければ,その文字が分離子であるかどうか  を検査する。分離子の場合は,その文字を無視する。

(3)その文字が区切り子の一部でもなく分離子でもなければ,その文字をデータとして  扱う。

(4)マークの中では,その文字が,区切り子の一部,分離子,区切り子でくくった表記  データ又は字句であるかどうかを検査する(8.6.6参照)。

  そのSGML文字が機能文字であった場合は,その他の扱いに加えて,その機能を実  行する。

5.2.1 分離子s

  s = SPACE | RE| RS| SEPCHAR ―(5)  SGML文字がs以外のマークとして解釈することができる場合は,そのSGML文字をs とは認知しない。sと認知した文字は,無視する。

5.2.2 実体終了Ee

 Eeは,実体の終了を示す信号とする。システムは,Eeを表現するのに,SGML文字 と区別することができるどんな方法を用いてもよい。

備考1. Eeは,文字でないので,データとはならない。Eeは,特別に許す位置 にだけ出現することができる。

2. システムは,非SGML文字が割り当てられている場合,Eeを非SGML文字 のビット組合せの一つで表現してもよい。

5.2.3 SGML宣言の補充

 SGML宣言は,SGML文書を単一のシステムだけで処理するのであれば,そのシステム に補充してもらってもよい。ただし,その文書を他のシステムに送るのであれば,明示 的に書いておかなければならない。

5.3 データ実体

  文字データ実体 = SGML文字*, Ee ―(5.1)   特定文字データ実体 = SGML文字*, Ee ―(5.2)   非SGMLデータ実体 = 文字*, Ee ―(6)

 文字データ実体,特定文字データ実体及び非SGMLデータ実体を,データ実体という。

備考 データ実体の宣言には,そのデータの解釈方法を指定する記法引数が添え てある。

SGML規格の案内へ戻る。 5.実体構造の案内へ戻る。 6.要素構造へ続く。