JTTC 0001:2003    (Pub. 2003-07-03)

XML情報集合

XML Information Set

W3C勧告 2001年10月24日

この版
http://www.w3.org/TR/2001/REC-xml-infoset-20011024
最新版
http://www.w3.org/TR/xml-infoset
以前の版
http://www.w3.org/TR/2001/PR-xml-infoset-20010810
著者
John Cowan, jcowan@reutershealth.com
Richard Tobin, richard@cogsci.ed.ac.uk

要約

この規定は,XML文書の中の情報を参照する必要がある他の規定における使用のための,定義の集合を提供する。

この文書の状況

この節は,この文書の公表時におけるこの文書の状況を記述する。他の文書が,この文書を置き換えるかもしれない。この文書の最新の状況は,W3Cにおいて保守される。

この文書は,XML情報集合(XML Information Set)の勧告である。

この文書は,W3Cメンバ及び関心のある団体によって審議され,W3Cの統括責任者によってW3C勧告として承認された。この文書は,安定した文書であり,参照文書として使用したり,他の文書から引用規定として引用したりしてよい。勧告作成におけるW3Cに役割は,規定への関心を集めること及び規定の広範囲の使用を促進することである。これによって,ウェブの機能性及び相互運用性が高められる。

この文書は,W3Cアーキテクチャ領域におけるXML活動の一部として,W3C XML Core作業グループによって生成された。この作業の背景については,XML活動声明を参照してほしい。

XML情報集合に関連する特許開示が存在する。これは,W3Cの方針に適合するXML情報集合についての特許声明のページにおいて見ることができる。

この文書における誤りは,www-xml-infoset-comments@w3.org(公開アーカイブ)に報告してほしい。
この規定における既知の誤りのリストは,http://www.w3.org/2001/10/02/xml-infoset-errata.htmlで入手可能である。

この規定の英語の版だけを規定的な版とする。この文書の翻訳についての情報は,http://www.w3.org/XML/#transで入手可能である。

現在のW3C勧告及び他の技術文書のリストは,http://www.w3.org/TRで見ることができる。

目次


1. 導入

この規定は,XML情報集合(XML Information Set)と呼ばれる(以下ではInfosetということもある)抽象データ集合を定義する。その目的は,整形式XML文書[XML]の中の情報を参照する必要がある他の規定での使用のために,定義の矛盾のない集合を提供することにある。

この規定は,完全であることを意図していない。情報項目又は特性の取込みに対する基本的な基準は,将来の規定において期待される有用性に基づくものとした。XML処理系が返さなければならない情報の最小集合を構成するものでもない。

XML文書は,それが整形式であって,に示す名前空間制約を満足する場合,情報集合をもつ。情報集合をもつためには,XML文書が妥当であるという要件は存在しない。

情報集合は,XML文書の構文解析ではなく(この規定では記述されない)方法によって生成されてもよい。合成的情報集合を参照すること。

XML文書の情報集合は,多くの情報項目(information item)から構成される。任意の整形式XML文書のための情報集合は,少なくとも一つの文書情報項目及び幾つかのその他のものを含む。情報項目は,XML文書のある部分の抽象的な記述とする。各々の情報項目は,関連する名前の付いた特性(property)の集合をもつ。この規定では,特性名は,[thus]のように,角括弧の中に示される。情報項目の型は,2.に一覧として示される。

情報集合は,特定のインタフェース又はインタフェースの特定のクラスを要求又は望ましいとすることはない。この規定は,明確さ及び簡単さのために,情報集合を修正された木として表すが,XML情報集合は木構造によって利用可能になるのがよいという要件は存在しない。イベントに基づくインタフェース及び問合せに基づくインタフェースを含む(ただしそれらに制限されない)インタフェースの他の型も,XML情報集合に適合する情報を提供可能とする。

用語"情報集合"及び"情報項目"は,一般的な用語"木"及び"ノード"と,それらが計算において使用される場合には,意味的に,類似している。しかし,前者の用語は,他の特定のデータモデルとの潜在的な混乱を軽減するために,この規定の中で使用される。情報項目は,DOMのノード又はXPathデータモデルの"木"及び"ノード"と1対1に対応付けられるわけではない

この規定の中では,表現,"しなければならない","することが望ましい",及び"してもよい"は,[RFC2119]で規定された意味を仮定する。

名前空間

[Namespaces]に適合しないXML 1.0文書は,技術的に整形式であっても,意味のある情報集合をもつとは考えない。すなわち,この規定は,[Namespaces]が規定するとおり以外の方法で使用されるコロンを含む要素名又は属性名をもつ文書に対して,情報集合を定義しない。

さらに,この規定は,名前空間宣言の中に相対URI参照を使用する文書に対して,情報集合を定義しない。これは,[Relative Namespace URI References]の中で記述されたW3C XML Plenary Interest Groupの決定に従っている。

[namespace name]特性の値は,対応する名前空間属性の正規化された値とする。付加的なURIエスケープ化は,処理系によって適用されない。

実体

情報集合は,それの,既に展開された実体参照をもつXML文書を記述する。すなわち,その実体参照は,置換テキストに対応する情報項目によって表現されている。しかし,処理系がこの展開を実行しなくてもよい様々な状況が存在する。実体は,宣言されなくてもよいし,検索可能でなくてもよい。妥当性検証を行わない処理系は,すべての宣言を読み込まないことを選択してもよいし,読み込んだとしても,すべての外部実体を展開しなくてもよい。これらの場合には,非展開実体参照情報項目が,その実体参照を表現するために使用される。

行末の取扱い

Infosetの中のすべての特性の値は,[XML]の2.11 "行末の取扱い"で記述される行末正規化を考慮する。

基底URI

幾つかの情報項目は,[base URI]特性又は[declaration base URI]特性をもつ。これらは,[XML Base]に従って計算される。資源の検索は,(例えば,実体解決器において,)構文解析又はそれより下のレベルで再指定先割当てを行ってもよい。この場合,基底URIは,すべての再指定先割当ての後で資源を検索するために使用される最終のURIとなる。

これらの特性の値は,資源の検索のために要求されてもよいURIエスケープ化を反映しない。しかし,その値は,エスケープされた文字を,それらが文書の中で指定された,又は再指定先割当てにおいてサーバによって返却された場合には,含んでもよい。

(文字列又はパイプから読み込まれた文書といった)幾つかの場合,[XML Base]における規則によって,基底URIが応用依存となってもよい。これらの場合,この基底は,[base URI]特性又は[declaration base URI]特性の値を定義しない。

相対URIを解決する場合,[base URI]が,xml:base属性の値に優先して使用されることが望ましい。それらは,合成的情報集合の場合,矛盾していてもよい。

"未知(unknown)"及び"値なし(no value)"

特性の中には,値,未知(unknown)又は値なし(no value)をもつものがあってもよく,それぞれ,特性値は未知である,又は特性値は値をもたない,という。これらの値は,互いに及びすべての他の値と異なっている。特に,それらは,単にメンバをもたないという,空文字列,空集合及び空リストとは異なっている。この規定は,用語ヌル(null)を使用しない。これは,この用語が,この規定で意図するものとは一致しなくてもよい特定の言外の意味をもっていることによる。

合成的情報集合

この規定は,XML文書を構文解析することから生じる情報集合を記述する。情報集合は,他の方法によって,例えば,DOMのようなAPIの使用によって,又は既存の情報集合を変換することによって,構築されてもよい。

現実の文書に対応する情報集合は,必ず,様々な方法で無矛盾になっている。例えば,要素の[in-scope namespaces]特性は,その要素及びその先祖の[namespace attributes]と矛盾しない。これは,他の方法によって構築された情報集合では正しくなくてもよい。そのような場合,その情報集合に対応するXML文書は存在せず,それを直列化するためには,(例えば,有効範囲の中の名前空間に対応する名前空間宣言を出力することによって,)その矛盾を解決することが要求される。

2. 情報項目

情報集合は,以下に示すとおり,情報項目の11個の異なる型までを含むことができる。すべての情報項目は,特性をもつ。参照を容易にするために,各特性には,[thus]と示される名前が与えられる。XML 1.0勧告[XML]における定義及び/又は構文へのリンクが,各情報項目に対して与えられる。

2.1 文書情報項目

XML定義  文書 (2. 文書)

XML構文 [1] document (2.1 整形式XML文書)

情報集合の中にはただ一つの文書情報項目(document information item)が存在し,すべての他の情報項目は,文書情報項目の特性から,他の情報項目の特性を通じて直接に又は間接にアクセス可能とする。

文書情報項目は,次の特性をもつ。

  1. [children]  子情報項目の文書順での順序付きリスト。リストは,ただ一つの要素情報項目を含む。さらにリストは,文書要素の外側の各処理命令に対して一つの処理命令情報項目,及び文書要素の外側の各注釈に対して一つの注釈情報項目も含む。DTD内の処理命令及び注釈は,除外される。文書型宣言が存在する場合には,リストは,文書型宣言情報項目も含む。
  2. [document element]  文書要素に対応する要素情報項目。
  3. [notations]  DTDの中に宣言された各記法ごとに一つの,記法情報項目の順序のない集合。
  4. [unparsed entities]  DTDの中に宣言された各(構文)解析対象外実体ごとに一つの,解析対象外実体情報項目。
  5. [base URI]  文書実体の基底URI。
  6. [character encoding scheme]  文書実体が表現される文字符号化方式の名前。
  7. [standalone]  文書のスタンドアロン状況の指示。yes又はnoとする。この特性は,文書実体の最初にあるXML宣言の中のオプションのスタンドアロン文書宣言から導出され,スタンドアロン文書宣言が存在しない場合には,値をもたない。
  8. [version]  文書のXML版を表現する文字列。この特性は,文書実体の最初にオプションで存在するXML宣言から導出され,XML宣言が存在しない場合には,値をもたない。
  9. [all declarations processed]  この特性は,厳密に言えば,文書の情報集合ではない。むしろ,処理系が完全なDTDを読むかどうかの指示とする。その値は,論理型とする。偽の場合,(以下の記述で示される)ある特性が未知であってもよい。真の場合,それらの特性は決して未知ではない。

2.2 要素情報項目

XML定義 要素 (3. 論理構造)

XML構文 [39] element (3. 論理構造)

XML文書の中に出現する各要素に対して要素情報項目(element information item)が存在する。要素情報項目の一つは,文書情報項目の[document element]特性の値であって,要素木のルートに対応する。他のすべての要素情報項目は,その[children]特性に再帰的に従うことによってアクセスできる。

要素情報項目は,次をもつ。

  1. [namespace name]  要素型の名前空間名。ただし,存在しないこともある。要素が名前空間に属さない場合には,この特性は値をもたない。
  2. [local name]  要素型名の局所部分。これは,名前空間接頭辞及びそれに続くコロンを含まない。
  3. [prefix]  要素型名の名前空間接頭辞部分。名前に接頭辞がない場合,この特性は値をもたない。名前空間を意識する応用は,要素を識別するためには,接頭辞ではなく名前空間名を使用するのが望ましいことに注意すること。
  4. [children]  子情報項目の文書順での順序付きリスト。このリストは,現在の文書内に直接に出現する,要素,処理命令,構文解析外外部実体への参照,データ文字及び注釈の各々に対して一つの,要素情報項目,処理命令情報項目,非展開実体参照情報項目,文字情報項目,及び注釈情報項目を含む。要素が空の場合には,このリストはメンバをもたない。
  5. [attributes]  この要素の(指定された又はDTDからデフォルトとされた)属性の各々ごとに一つの,属性情報項目の順序なし集合。名前空間宣言は,この集合の中には現れない。要素が属性をもたない場合には,この集合はメンバをもたない。
  6. [namespace attributes]  この要素の(指定された又はDTDからデフォルトとされた)名前空間宣言の各々ごとに一つの,属性情報項目の順序なし集合。デフォルト名前空間を非宣言化する形式xmlns=""の宣言は,名前空間宣言として数える。定義によって,([prefix]特性が値をもたないxmlnsで名前付けされたものを含む)すべての名前空間属性は,http://www.w3.org/2000/xmlns/の名前空間URIをもつ。要素が名前空間宣言をもたない場合には,この集合はメンバをもたない。
  7. [in-scope namespaces]  この要素に対して実効的な名前空間の各々ごとに一つの,名前空間情報項目の順序なし集合。この集合は,常に,名前空間名http://www.w3.org/XML/1998/namespaceに暗黙的に結合された接頭辞xmlをもつ項目を含む。(名前空間を宣言するために使用される)接頭辞xmlnsをもつ項目は含まない。これは,応用がその接頭辞をもつ要素又は属性には決して出会うことができないことによる。集合は,名前空間を宣言しないでむしろデフォルト名前空間を非宣言化する形式xmlns=""の宣言を表現するものを除いた,[namespace attributes]のメンバすべてに対応する名前空間項目を含む。修飾された名前の接頭辞を解決する場合,この特性が,[namespace attributes]特性に優先して使用されることが望ましい。合成的情報集合の場合,矛盾が生じるかもしれない。
  8. [base URI]  要素の基底URI。
  9. [parent]  [children]特性の中にこの情報項目を含む文書情報項目又は要素情報項目。

2.3 属性情報項目

XML定義 属性 (3.1 開始タグ,終了タグ及び空要素タグ)

XML構文 [41] Attribute (3.1 開始タグ,終了タグ及び空要素タグ)

名前空間宣言となるものを含む,文書の中の各要素の(指定された又はデフォルトとされた)各属性に対して,属性情報項目(attribute information item)が存在する。ただし,名前空間宣言となるものは,要素の[attributes]特性ではなく[namespace attributes]特性のメンバとして出現する。

DTDの中でデフォルト値なしで宣言され要素の開始タグの中で指定されていない属性は,属性情報項目によって表現されない。

属性情報項目は,次の特性をもつ。

  1. [namespace name]  存在する場合には,属性の名前空間名。存在しない場合には,この特性は値をもたない。
  2. [local name]  属性名の局所部分。これは,名前空間接頭辞及びそれに続くコロンを含まない。
  3. [prefix]  属性名の名前空間接頭辞部分。名前に接頭辞がない場合には,この特性は値をもたない。名前空間を意識する応用は,要素を識別するためには,接頭辞ではなく名前空間名を使用するのが望ましいことに注意すること。
  4. [normalized value]  正規化された属性値(3.3.3 属性値の正規化 [XML]を参照)。
  5. [specified]  この属性が,実際に,要素の開始タグの中で指定されていたか,又はDTDからデフォルトとされていたかをどうかを示すフラグ。
  6. [attribute type]  DTDの中でこの属性のために宣言された型の指示。文法に合った値は,ID,IDREF,IDREFS,ENTITY,ENTITIES,NMTOKEN,NMTOKENS,NOTATION,CDATA,及びENUMERATIONとする。属性のための宣言が存在しない場合,この特性は値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言があってもよい)場合,この特性の値は,未知とする。応用は,値なし(no value)及び未知(unknown)をCDATAの値と等価として取り扱うのがよい。
  7. [references]  属性型がID,NMTOKEN,NMTOKENS,CDATA又はENUMERATIONの場合,この特性は値をもたない。属性型が未知の場合,この特性の値は未知とする。そうでない場合(すなわち,属性型がIDREF,IDREFS,ENTITY,ENTITIES又はNOTATIONの場合),この特性の値は,属性値を参照する要素情報項目,解析対象外実体情報項目又は記法情報項目の,それらが出現する順序での順序付きリストとする。この場合,属性値が構文的に妥当でないとき,この特性は値をもたない。型がIDREF又はIDREFSであって,IDが文書の中にID属性の値として出現しない場合,又は型がENTITY,ENTITIES又はNOTATIONであって,実体又は記法に対する宣言が読まれなかった場合,この特性は,文書情報項目の[all declarations processed]特性が真又は偽であることに依存して,値をもたないか又は未知とする。型がIDREF又はIDREFSであって,IDが文書の中の一つより多くのID属性の値として出現する場合,この特性は値をもたない。
  8. [owner element]  この情報項目を[attributes]特性の中に含む要素情報項目。

2.4 処理命令情報項目

XML定義  処理命令 (2.6 処理命令)

XML構文  [16] PI (2.6 処理命令)

文書の中の各処理命令ごとに処理命令情報項目(processing instruction information item)が存在する。外部解析対象実体のためのXML宣言及びテキスト宣言は,処理命令とは考えない。

処理命令情報項目は,次の特性をもつ。

  1. [target]  処理命令のターゲット部分を表現する文字列(XMLの名前)。
  2. [content]  処理命令の内容を表現する文字列。ただし,ターゲット及びそれの直後の空白は除く。そのような内容が存在しない場合,この特性の値は,空文字列とする。
  3. [base URI]  PIの基底URI。情報集合がXML文書として直列化される場合,外部実体の最上位に元々出現していたあらゆるPIの基底URIを保存することはできない点に注意すること。これは,要素上のxml:base属性に対応するPIのための構文が存在しないことによる。
  4. [notation]  ターゲットによって名前付けされる記法情報項目。その名前をもつ記法に対する宣言が存在しない場合には,この特性は値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言が存在してもよい)場合,この特性の値は未知とする。
  5. [parent]  この情報項目を[children]特性の中に含む,文書情報項目,要素情報項目又は文書型定義情報項目。

2.5 非展開実体参照情報項目

XML定義  4.4.3 含まれる条件の妥当性検証

非展開実体参照情報項目(unexpanded entity reference information item)は,XML処理系が外部解析対象実体を展開していないことを示すことができるプレースホルダとして役に立つ。要素の内容内の外部一般実体への各非展開参照に対しては,このような情報項目は存在しない。妥当性検証を行うXML処理系,又はすべての外部一般実体を読む妥当性検証を行わない処理系は,妥当な文書に対して,決して,非展開実体参照情報項目を生成しない。

非展開実体参照情報項目は,次の特性をもつ。

  1. [name]  参照される実体の名前。
  2. [system identifier]  実体のシステム識別子。ただし,実体の宣言の中に出現するとおりとし,処理系によって適用される付加的なURIのエスケープ化はないものとする。事態に対する宣言が存在しない場合,この特性は値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言が存在してもよい)場合,この特性の値は未知とする。
  3. [public identifier]  4.2.2 外部実体[XML]で記述されるとおりに正規化された,実体の公開識別子。実体に対する宣言が存在しない場合,又は宣言が公開識別子を含まない場合,この特性は値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言が存在してもよい)場合,この特性の値は未知とする。
  4. [declaration base URI]  システム識別子がそれに相対的に解決されることが望ましい基底URI。すなわち,実体宣言がその内部に出現する資源の基底URI。これは,[system identifier]特性と同じ状況で,未知となったり,値をもたなかったりする。
  5. [parent]  この情報項目を[children]特性の中に含む要素情報項目。

2.6 文字情報項目

XML構文  [2] Char (2.2 文字)

文書の中に,文字どおりに,文字参照として,又はCDATAセクション内に,出現する各データ文字ごとに,文字情報項目(character information item)が存在する。

各文字は,論理的に別々の情報項目とするが,XML応用は,必要又は望むとおりに,文字の集まりをより大きなグループへの固まりとして自由に扱ってよい。

文字情報項目は,次の特性をもつ。

  1. [character code]  文字の,0〜#x10FFFFの範囲でのISO 10646文字コード。ただし,この範囲のすべての値が,文法に合ったXMLの文字コードではない。
  2. [element content whitespace]  文字が要素内容内に出現する空白かどうかを示す論理値([XML],2.10 "空白の取扱い"を参照)。妥当性検証を行うXML処理系は,この情報を提供することを,XML 1.0によって要求されることに注意すること。含む側の要素のための宣言が存在しない場合,この特性は,空白文字に対して値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言が存在してもよい)場合,この特性の値は,空白文字に対して未知とする。空白でない文字に対しては,常に偽とする。
  3. [parent]  この情報項目を[children]特性の中に含む要素情報項目。

2.7 注釈情報項目

XML定義  注釈 (2.5 注釈)

XML構文  [15] Comment (2.5 注釈)

元の文書の中の各XML注釈ごとに注釈情報項目(comment information item)が存在する。ただし,DTDの中に出現する(表現されていない)ものは除く。

注釈情報項目は,次の特性をもつ。

  1. [content]  注釈の内容を表現する文字列。
  2. [parent]  この情報項目を[children]特性の中に含む文書情報項目又は要素情報項目。

2.8 文書型宣言情報項目

XML定義  文書型宣言 (2.8, 前書き及び文書型宣言)

XML構文  [28] doctypedecl (2.8, 前書き及び文書型宣言)

XML文書が文書型宣言をもつ場合,情報集合は,一つの文書型宣言情報項目(document type declaration information item)を含む。実体及び記法は,文書情報項目の特性として提供されており,文書型宣言情報項目ではないことい注意すること。

文書型宣言情報項目は,次の特性をもつ。

  1. [system identifier]  外部部分集合のシステム識別子。ただし,DOCTYPE宣言の中に出現するとおりとし,処理系によって適用される付加的なURIエスケープ化なしとする。外部部分集合が存在しない場合、この特性は値をもたない。
  2. [public identifier]  4.2.2 外部実体[XML]で記述されるとおりに正規化された,外部部分集合の公開識別子。外部部分集合が存在しない場合,又はそれが公開識別子をもたない場合,この特性は値をもたない。
  3. [children]  DTDの中に出現する処理命令を表現する処理命令情報項目の,元の文書順での,順序付きリスト。内部DTD部分集合からの項目は,外部部分集合の中の項目よりも前に出現する。
  4. [parent]  文書情報項目。

2.9 解析対象外実体情報項目

XML定義  実体 (4. 物理構造)

XML構文  [71] GEDecl (4.2 実体)

DTDの中に宣言された各解析対象外一般実体ごとに解析対象外実体情報項目(unparsed entity information item)が存在する。

解析対象外実体情報項目は,次の特性をもつ。

  1. [name]  実体の名前。
  2. [system identifier]  実体のシステム識別子。ただし,実体の宣言の中に出現するとおりとし,処理系によって適用される付加的なURIエスケープ化なしとする。
  3. [public identifier]  4.2.2 外部実体[XML]で記述されるとおりに正規化された,実体の公開識別子。実体が公開識別子をもたない場合,この特性は値をもたない。
  4. [declaration base URI]  システム識別子がそれに相対的に解決されることが望ましい基底URI。すなわち,実体宣言が内部に出現する資源の基底URI。
  5. [notation name]  実体に関連付けられた記法名。
  6. [notation]  記法名によって名前付けされた記法情報項目。その名前をもつ記法のための宣言が存在しない場合,この特性は値をもたない。宣言が読まれなかったが,文書情報項目の[all declarations processed]特性が偽になっている(したがって,読まれない宣言が存在してもよい)場合,この特性の値は,未知とする。

2.10 記法情報項目

XML定義  記法 (4.7 記法)

XML構文  [82] NotationDecl (4.7 記法)

DTDの中で宣言される各記法ごとに記法情報項目(notation information item)が存在する。

記法情報項目は,次の特性をもつ。

  1. [name]  記法の名前。
  2. [system identifier]  記法のシステム識別子。ただし,記法の宣言の中に出現するとおりとし,処理系によって適用される付加的なURIエスケープ化なしとする。システム識別子が指定されなかった場合,この特性は値をもたない。
  3. [public identifier]  4.2.2 外部実体[XML]で記述されるとおりに正規化された,記法の公開識別子。記法が公開識別子をもたない場合,この特性は値をもたない。
  4. [declaration base URI]  システム識別子がそれに相対的に解決されることが望ましい基底URI。すなわち,記法宣言が内部に出現する資源の基底URI。

2.11 名前空間情報項目

文書の中の各要素は,その要素のための有効範囲の中にある各名前空間ごとに名前空間情報項目(namespace information item)をもつ。

名前空間情報項目は,次の特性をもつ。

  1. [prefix]  この項目が記述する結合を与える接頭辞。構文的には,これは,xmlns:接頭辞に続く属性名の一部とする。属性名が単にxmlnsであって,その結果,宣言がデフォルト名前空間による場合,この特性は値をもたない。
  2. [namespace name]  接頭辞が結合される名前空間名。

3 適合性

情報集合の目的は定義の集合を提供することなので,適合性は,実装ではなく,それらの定義を使用する規定の特性とする。

情報集合を参照する規定は,次を行わなければならない。

規定が,合成的情報集合の下で先に示したとおりの矛盾をもつ情報集合の構築を許す場合,それらの矛盾をどのように解決するのがよいかを示してもよく,規定が情報集合の直列化を提供する場合には,それを行うことが望ましい。

附属書A 文献

引用規定

ISO/IEC 10646
ISO (International Organization for Standardization). ISO/IEC 10646-1993 (E). Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane. [Geneva]: International Organization for Standardization, 1993 (及び追補 AM 1 through AM 7).
Namespaces
Namespaces in XML, W3C, eds. Tim Bray, Dave Hollander, Andrew Layman. 14 January 1999. http://www.w3.org/TR/REC-xml-names/で入手可能。
RFC2119
Key words for use in RFCs to Indicate Requirement Levels, ed. S. Bradner. March 1997. http://www.ietf.org/rfc/rfc2119.txtで入手可能。
XML
Extensible Markup Language (XML) 1.0 (Second Edition), W3C, eds. Tim Bray, Jean Paoli, C.M. Sperberg-McQueen, Eve Maler. 6 October 2000. http://www.w3.org/TR/REC-xmlで入手可能。
XML Base
XML Base, W3C, ed. Jonathan Marsh. February 2000. http://www.w3.org/TR/xmlbaseで入手可能。

参考文献

DOM
Document Object Model (DOM) Level 1 Specification, W3C, eds. Vidur Apparao, Steve Byrne, Mike Champion, et al. 1 October 1998. http://www.w3.org/TR/REC-DOM-Level-1/で入手可能。
XPointer-Liaison
XPointer-Information Set Liaison Statement, W3C, ed. Steven J. DeRose. 24 February 1999. http://www.w3.org/TR/NOTE-xptr-infoset-liaisonで入手可能。
Relative Namespace URI References
Results of W3C XML Plenary Ballot on relative URI References in namespace declarations, 3-17 July 2000, W3C, eds. Dave Hollander, C. M. Sperberg-McQueen. 6 September 2000. http://www.w3.org/2000/09/xppaで入手可能。
RDF Schema for the XML Information Set
RDF Schema for the XML Information Set, W3C, ed. Richard Tobin. 6 April 2001. http://www.w3.org/TR/xml-infoset-rdfsで入手可能。

附属書B XML 1.0報告要件(参考)

XML 1.0勧告[XML]は,基本的にXML構文に関心があるが,XML処理系のための幾つかの特定の報告要件も含んでいる。

報告要件は,この規定の適用範囲外のエラー及び文書情報を含む。文書情報報告のためのXML 1.0要件のすべては,XML情報集合に統合された。(次において,)括弧の中の数字は,XML勧告の節を参照する。

  1. XML処理系は,応用へのマーク付けの一部ではない文書の中のすべての文字を提供しなければならない(2.10)。
  2. 妥当性を検証するXML処理系は,応用に,文書の中のどの文字データを要素内容内に出現する空白とするかを知らせなければならない(2.10)。
  3. XML処理系は,行末を,応用に渡す前にLFに正規化しなければならない(2.11)。
  4. XML処理系は,属性の値を,応用に渡す前に3.3.3における規則に従って正規化しなければならない。
  5. XML処理系は,応用に,宣言された記法の名前及び外部識別子(システム識別子,公開識別子又はそれらの両方)を渡さなければならない(4.7)。
  6. 解析対象外実体の名前がENTITY属性又はENTITIES属性の明示的な値又はデフォルトの値として出現する場合,XML処理系は,応用に,実体及びその記法の名前,システム識別子,及び(存在する場合には)公開識別子を提供しなければならない(4.6及び4.7)。
  7. XML処理系は,応用に,処理命令を渡さなければならない(2.6)。
  8. 実体参照の箇所に外部構文解析対象実体の置換テキストを含めないXML処理系(必然的に妥当性検証を行わない処理系)は,応用に,実体を認識したが読まなかったということを通知しなければならない(4.4.3)。
  9. 妥当性検証を行うXML処理系は,実体参照の箇所に実体の置換テキストを含めなければならない(5.2)。
  10. XML処理系は,与えられた要素型に対してDTDの中で宣言されたが要素の開始タグの中に出現していない属性のデフォルト値を,供給しなければならない(3.3.2)。

附属書C 例(参考)

次のXML文書の例を検討する。

<?xml version="1.0"?>

<msg:message doc:date="19990421"
             	xmlns:doc="http://doc.example.org/namespaces/doc"
             	xmlns:msg="http://message.example.org/"
>Phone home!</msg:message>

このXML文書に対する情報集合は,次の情報項目を含む。

附属書D 情報集合には含まれないもの

次の情報は,XML情報集合の現在の版では表現されない。ただし,この一覧は,完全であることを意図してはいない。

  1. DTDの中のELEMENT宣言からの,要素の内容モデル。
  2. ATTLIST宣言の中の属性宣言のグループ化及び順序付け。
  3. 文書型名。
  4. 文書(document)要素の外部の空白。
  5. PIのターゲット名の直後の空白。
  6. 文字が文字参照によって表現されるかどうか。
  7. 空要素の二つの形式,<foo/><foo></foo>との間の差異。
  8. 開始タグ及び終了タグの内部の空白。ただし,属性値の中の意味のある空白は除く。
  9. CR,CR-LF及びLFの行終端の間の差異。
  10. 開始タグ内の属性の順番。
  11. DTD内の宣言の順番。
  12. DTDの中の条件付きセクションの境界。
  13. DTDの中のパラメタ実体の境界。
  14. DTDの中の注釈。
  15. 宣言の位置。すなわち,内部部分集合の中,外部部分集合の中,又はパラメタ実体の中かということ。
  16. 任意の無視された宣言。これは,IGNORE条件付きセクションの宣言,以前の宣言が上書きされたために無視された実体宣言及び属性宣言を含む。
  17. 属性値を引用するために使用する引用符記号の種類(一重引用符又は二重引用符)。
  18. 一般解析対象実体の境界。
  19. CDATAマークされたセクションの境界。
  20. DTDの中で宣言された属性のデフォルト値。

附属書E RDFスキーマ(参考)

情報集合の形式的な特徴づけについては,XML情報集合のためのRDFスキーマを参照すること。