Copy rights (C) 1997 NCALS, All rights reserved. Guide line for Indexing Process

Guide line for Indexing Process(索引処理の指針)

 ここでは,
NCALSはん用DTDの規定に従って作成された SGML文書要素"索引登録標識"(indxflag)及びその属性(ref1, ref2,ref3,ref4)を元に,索引処理によって, 文書後部(rear) のための索引(index)を生成する外部処理の手引きを示す。 ここで記述した内容は,利用者の参考のためであって,DTD規定 の一部ではない。この索引処理は,応用によって処理内容及び 目標水準が定められる。 備考 NCALSはん用DTD適合文書では,索引(index)は,文書の     後部(rear)に位置して,目次(contents)又は用語集 (glossary)とは異なる角度から,文書中の関心部分を 探索したい場合に使われることを想定している。 したがって,電子文書(動的文書)での結合(例:投錨) による引用とは違う用途となる。 案内 1.索引データの収集(data collection for index) 2.索引の見出し語の分類(sorting of key word for index) 3.ncalsDTD規定の最初へ戻る。

1.索引データの収集(data collection for index)

1.1 NCALSはん用DTD適合文書からの索引項目の抽出 1.1.1 割付け文書からの収集(省略時値) 文書体部(body)を探索し,要素"索引登録標識"(indxflag) の属性(ref1..ref4)によって示す字句ごとに,その要素の所属 する論理構造の"ページ番号の値"を並べる。 要素"索引登録標識"の属性(ref1,..,ref4)には,文字データ (CDATA)によって,
索引のための見出し語を記述する。その場合, ref1が最初に使用されるが,最大4とおり指定してもよい。 備考:漢字の場合,この属性に読み方を書いてもよいし, 英文単語を併記してもよい。これらの使い方は,その     索引の目的によって,応用者が決める。 例 原文書: 索引部:ろんりぶんしょからのしゅうしゅう 112 論理文書からの収集         123 indexing of logical document 123 1.1.2 論理文書(割付け処理のされていない文書)からの収集 文書体部(body)を探索し,要素"索引登録標識"(indxflag) の属性(ref1,...,ref4)によって示す字句ごとに,その要素の所属 する論理構造の箇条番号(chapter,section,para0)の値を並べる。 要素"索引登録標識"の属性(ref1,..,ref4)には,文字データ によって,"索引の見出し語"を記述する。その場合,ref1が最初に 使用されるが,最大4とおり(ref4まで)指定してもよい。 備考:漢字の場合,この属性に読み方を書いてもよいし, 英文単語を併記してもよい。これらの使い方は,その    索引の目的によって,応用者が決める。 例 原文書: 索引部:ろんりぶんしょからのしゅうしゅう 1.1.1 論理文書からの索引収集         1.1.1 indexTitle 1.1.1 1.2 NCALSはん用DTD以外の場合   すべて,そのDTD規定による。 案内 0.この文書の頭へ戻る。 1.索引データの収集(data collection for index)へ戻る。 2.索引の見出し語の分類(sorting of key word for index)へ進む。 3.ncalsDTD規定の最初へ戻る。

2.索引の見出し語の分類(sorting of key word for index)

2.1 読みの付与 索引見出しの読み方の指定は,次のa)及びb)の2とおりがある。 a)要素"indxflag"の属性(ref1,..,ref4)によって,原始文書で  指定される場合,
1.1.1による。 b)用語辞書によって,読みが与えられる場合。 この場合,一括付与によって,登録字句が用語辞書に発見でき  ないとき,及び省略時値(例えば,音による読み)で不適切な  ときは,対話によって辞書に登録する。 備考 この用法は,用語集(glossary)と共用するなどの場合であって, 字句ではなく,用語が索引見出し語になる場合に応用される   ことが多い。 2.2 分類方式の指定(selection of sorting method) 2.2.1 照合順序方式の選択(selection of collative sequence) 分類の方式は,次のa)~e)から選択される。 a)50音("あいうえお")順 b)"いろは"順 c)アルファベット("ABC")順 d)応用特定順(例:電話番号簿の姓名) e)漢字符号表(例:JIS X 0208) 2.2.2 等価処理(equalization) 分類の前処理として,次のa)~g)の文字の等価処理を行なう。 a)濁音及び半濁音の清音変換 b)拗音の清音変換 c)長音の削除 d)英字の1バイト変換及び大文字変換 e)片仮名文字の2バイト変換 f)片仮名文字の平仮名変換 g)活用語の変化の対処指定 2.3 分類結果の審査(reviewing of the result) 分類結果は審査され,適切と判断されるまで,分類を繰り返す。 a)読みの不適切が発見された場合,文書の必要箇所を修正する。 b)用語辞書の読みが不適切な場合,用語辞書を更新する。 案内 0.この文書の頭へ戻る。 2.索引の見出し語の分類(sorting of key word for index)へ戻る。 3.結果の投入(insertion of the result into document)へ進む。 4.ncalsDTD規定の最初へ戻る。

3.結果の投入(insertion of the result into document)

3.1 論理文書(電子文書又はソフトコピー)の場合 分類結果は,NCALS-はん用DTD適合文書とするとき,索引(index)へ 挿入できない。 3.2 割付け文書(紙への印刷)の場合 分類結果は,割付け体裁付与の後,
索引(index)として添加される。 以上 案内 0.この文書の頭へ戻る。 1.ncalsDTD規定の最初へ戻る。 3.SGML規格の案内へ飛ぶ。