附属書 B. 索引生成サンプルXMLインスタンス (sample2.xml)

<?xml version="1.0" encoding="Shift_JIS"?> <?xml-stylesheet type="text/xsl" href="index.xsl"?> <document> <title>XSLTライブラリ</title> <chapter> <title>1. 序文(背景)</title> <p><term>XSLT</term>は<term1>XML文書</term1>を変換するための言語規定として<term1>W3C</term1>によって1999年に勧告された。XSLTや<term>DSSSL変換言語</term>による構造化文書処理の一般化は多目的で生成される電子文書利用の多様化と自動化を促進することが期待されている。特に,XSLT処理系は,XML文書の普及と呼応して,誰もが入手できる処理系として関係業界に認知されつつあるとともに,2001年時点での機能実装も実用に十分な水準に達しつつある。変換処理による構造化文書の利用拡大は,共通符号化と文書構造化の原初の目的の一つでもあり,関係業界だけでなく利用者一般からも変換処理の一般化や共有化が求められるようになった。このような要請に応えるため,XSLTライブラリを開発し,XML文書の利用拡大を目的とした変換処理をXSLTライブラリとして公開することにより,産業全般の構造化文書の処理効率を向上させることを目標としている。</p> </chapter> <chapter> <title>2. 適用範囲(目的)</title> <p>XSLTライブラリは<term1>XML文書</term1>を自動的に再編集する処理記述を一般化し共有することを目的とする。</p> <p>変換処理の目的は対象とされる文書の用途に応じて多様に存在し得る。文書を利用する目的のうちで,人手によらず処理を自動化することが期待されるものすべてが変換処理の目的と成り得る。ただし,ここではXSLT規定の性質上,自動化可能な変換処理は変換される対象をXML文書とすること,指定可能な文書構造要素が<term>XPath規定</term>によって制限されること,変換後のスタイル処理はXSLTの目的対象外とすることが主な制約となる。このため,<term>深階層構造</term>をもつ文書に対する高度なスタイル指定や文脈に依存した照会を前提とした変換処理はいずれDSSSL変換言語で処理することを期待し,2001年現在のXSLT処理系を使って,携帯端末でも精神的疲労を感じない応答速度で処理可能な文書の再編集を目標とする。</p> </chapter> <chapter> <title>3. 引用規格</title> <p>TBD</p> </chapter> <chapter> <title>4. 定義</title> <p>TBD</p> </chapter> <chapter> <title>5. 変換用途の区分及び変換要素の指定</title> <p>XSLT処理系でXML文書を再編集する目的で変換処理するためのXSLTライブラリは処理後の用途に応じて提供される。ここでは,XSLT処理の変換用途の区分を規定する。また,変換のための要素指定がXPathで制約されるため,変換要素の指定方法を文書型定義における要素属性の設計によって指定機能を補完可能な場合の変換要素の指定を規定する。</p> <section> <title>5.1 変換用途の区分</title> <p><term>変換用途</term>は,文書の<term>校閲</term>,<term>副文書</term>の生成,文書の<term>様式変換</term>,文書の<term>構造変換</term>,文書の<term>保守</term>,文書内容に対する<term>加筆訂正</term>に区分し,それらに共通の変換として区分されるものを合わせてXSLTライブラリとして提供する。</p> <sub-section> <title>5.1.1 文書の校閲</title> <p>文書を<term>校閲</term>するために文書の変換を行う用途に対して,次の機能をXSLTライブラリで提供する。</p> <list> <item>用語の置換</item> <item>文章の置換</item> <item>禁止用語の置換あるいは除去</item> <item>のぞましくない文章の置換あるいは除去</item> <item>置換あるいは除去でプログラムが推奨する処理の提示</item> <item>置換あるいは除去処理済み一覧の提示</item> <item>校閲履歴文書の作成</item> <item>校閲作業の手戻り処理</item> </list> </sub-section> <sub-section> <title>5.1.2 副文書の生成</title> <p>副文書を生成するために文書の変換を行う用途に対して,次の機能をXSLTライブラリで提供する。</p> <list> <item><term>目次</term>の生成</item> <item><term>索引</term>の生成</item> <item>目次及び索引のためのアンカの埋め込み</item> <item>目次及び索引のためのアンカの一覧の提示</item> <item>目次及び索引のためのアンカの除去</item> <item>複数文書のための<term>総合索引</term>の生成</item> </list> </sub-section> <sub-section> <title>5.1.3 文書の様式変換</title> <p>文書を様式変換する用途に対して,次の機能をXSLTライブラリで提供する。</p> <list> <item>HTML 4.0対応向け文書への変換</item> <item>文字符号化様式の変換</item> <item>データベース様式のデータファイルへの変換の一般例</item> </list> </sub-section> <sub-section> <title>5.1.4 文書の構造変換</title> <p>文書の構造・要素を変換する用途に対して,次の機能をXSLTライブラリで提供する。</p> <list> <item>文書の構造・要素の変換の一般例</item> <item>書誌情報のための構造・要素の変換の一般例</item> <item>名簿情報のための構造・要素の変換の一般例</item> <item>データベースから構造化文書への変換の一般例</item> </list> </sub-section> <sub-section> <title>5.1.5 文書の保守</title> <p>文書の保守を支援するための次の機能をXSLTライブラリで提供する。</p> <list> <item>リンク情報の一覧作成</item> <item>外部参照されている画像・音声・動画ファイルの一覧作成</item> <item>複数の文書構造を比較,報告書作成</item> <item>複数の文書内容を比較,報告書作成</item> <item>文書から一般化された文書型定義の抽出</item> <item>文書の改訂作業に伴う履歴文書の生成</item> <item>文書から単語を抽出し,構造化文書として単語一覧を自動生成</item> <item>文書型定義の比較,報告書作成</item> </list> </sub-section> <sub-section> <title>5.1.6 文書内容に対する加筆訂正</title> <p>文書内容に対する加筆訂正のために次の機能をXSLTライブラリで提供する。</p> <list> <item>章節の番号の生成と加筆の一般例</item> </list> </sub-section> <sub-section> <title>5.1.7 共通変換</title> <p>文書内容のデータ変換のために次の機能を共通化してXSLTライブラリで提供する。</p> <list> <item>年号変換</item> <item>通貨変換</item> <item>日付変換</item> <item>単位変換</item> <item>方言変換</item> </list> </sub-section> </section> <section> <title>5.2 変換要素の指定</title> <p>TBD</p> </section> </chapter> <chapter> <title>6. XSLTライブラリ</title> <p>TBD</p> </chapter> <chapter> <title>附属書A. 文章の校閲</title> <p>TBD</p> <section> <title>A.1 用語の置換</title> <p>TBD</p> </section> <section> <title>A.2 文章の置換</title> <p>TBD</p> </section> <section> <title>A.3 禁止用語の置換又は除去</title> <p>TBD</p> </section> <section> <title>A.4 望まししくない文章の置換又は除去</title> <p>TBD</p> </section> <section> <title>A.5 置換又は除去でプログラムが推奨する処理の提示</title> <p>TBD</p> </section> <section> <title>A.6 置換又は除去処理済み一覧の提示</title> <p>TBD</p> </section> <section> <title>A.7 校閲履歴文書の作成</title> <p>TBD</p> </section> <section> <title>A.8 校閲作業の手戻り処理</title> <p>TBD</p> </section> </chapter> <chapter> <title>附属書B. 副文書の生成</title> <p>文書内容からある条件に合致する要素を選択的に取出し,文書の本文とは別に目次又は索引としての部品を生成することができる。この規定では,そのような部品として生成される文書を副文書と呼び,文書の主体となる本文のための構成部分とは区別している。</p> <p>副文書の構成要素に対するスタイル指定は,本文での同じ要素に対する表現とは明らかに別のスタイル指定をしなければならない。そのためには副文書の生成に伴い,本文を構成する副文書に関連した要素に対しても別のスタイル指定可能が可能になるような予備変換としての記述が必要になる。このような変換記述を任意に追加可能にするために,副文書を生成しない場合でも,文書の本文の変換だけのための記述であることを明示する手段を用いるべきである。本文の変換を他の用途の変換記述から隔離することで,本文の変換結果を所定のスタイルに保つことが可能になる。</p> <section> <title>B.1 目次の生成</title> <p>目次(Table of Contents)を生成する変換処理は,とても単純に記述できる。目次を構成する...</p> </section> <section> <title>B.2 索引の生成</title> </section> <section> <title>B.3 目次及び索引のためのアンカの埋め込み</title> <p>目次及び索引を生成した場合,目次及び索引の各項目から章又は節の主題及び索引対象に対してリンク付けするためには,各々のリンクの各々の参照先に対してアンカと呼ばれる個別の識別子を埋め込む必要がある。その識別子は,一意でなければならない。</p> </section> <section> <title>B.4 目次及び索引のためのアンカの一覧の提示</title> </section> <section> <title>B.5. 目次及び索引のためのアンカの除去</title> </section> <section> <title>B.6 複数文書のための総合索引の生成</title> </section> </chapter> <chapter> <title>附属書 C.</title> <p>TBD</p> </chapter> <chapter> <title>附属書 D.</title> <p>TBD</p> </chapter> <chapter> <title>附属書 E.</title> <p>TBD</p> </chapter> <chapter> <title>附属書 F.</title> <p>TBD</p> </chapter> <chapter> <title>附属書 G.</title> <p>TBD</p> </chapter> <footer> 以上 </footer> </document>