6 基本HTMLデータ型

6.では,要素の内容又は属性の値として現われる基本データ型を規定する。

HTML DTDの読み方に関する導入情報については, SGMLの概説を参照されたい。

6.1 大文字・小文字情報

各属性定義は, その値の 大文字及び小文字の区別に関する情報を含む。大文字・小文字の情報は, 次のキーで表される。

CS
値は, 大文字及び小文字を区別する。例えば利用者エージェントは, "a"と"A"とを異なるものと解釈する。
CI
値は, 大文字及び小文字を区別しない。例えば,利用者エージェントは, "a"と"A"とを同じものと解釈する。
CN
値は, 大文字・小文字の変更の対象ではない。これは,例えばその値が,数か,又は文書文字集合からの文字であることによる。
CA
要素又は属性の定義自体が, 大文字・小文字の情報を与える。
CT
大文字及び小文字の区別に関する詳細は,型定義を参照のこと。

属性値がリストの場合,特にそうでないと示されない限り,キーは,リストのすべての値に適用される。

6.2 SGML基本型

文書型定義は,PCDATA,CDATA,NAME,IDなどの SGMLトークンを使用して,HTML要素の内容及び属性値の構文を指定する。 全規定については, [ISO8879]を参照のこと。キー情報の要約を 次に示す。

6.3 テキスト列

多くの属性(DTDにおける %Text;)は, "人間可読"であることを意味するテキストをとる。属性に関する導入情報については, 属性の概説を参照のこと。

6.4 URI

この規定は, [URI]で定義される用語URIを用いる。 ([RFC1630]も参照。)

URIは, [RFC1738]及び [RFC1808]で定義されるとおり,URLを含むことに 注意されたい。

相対URIは,基本URIを用いて完全URIに解決される。 [RFC1808]の第3節が, この処理の標準的なアルゴリズム を定義している。 基本URIに関する詳細情報は,linksの章の 基本URIの節を参照されたい。

URIは, DTDの中でパラメタ実体 %URI;によって表現される。

一般にURIは, 大文字及び小文字を区別する大文字及び小文字の区別が問題でない(マシンの名前など)URI又はURIの一部があってもよいが,これらを識別するのは容易ではない。 利用者は常に,安全側から,URIは大文字及び小文字を区別すると考えることが望ましい。

URI属性値における非ASCII文字 の情報については, 附属書を参照のこと。

6.5

属性値型"color"(%Color;)は, [SRGB]で指定される 色定義を参照する。 色の値は,番号記号('#'のこと。原規定では,hash mark。)の後の16進数又は次の16色名の一つのいずれかとする。 色名は, 大文字及び小文字を区別しない

色名及びsRGB値
Black="#000000" Green="#008000"
Silver="#C0C0C0" Lime="#00FF00"
Gray="#808080" Olive="#808000"
White="#FFFFFF" Yellow="#FFFF00"
Maroon="#800000" Navy="#000080"
Red="#FF0000" Blue="#0000FF"
Purple="#800080" Teal="#008080"
Fuchsia="#FF00FF" Aqua="#00FFFF"

したがって, 色値の"#800080"及び"Purple"は, どちらも紫色を参照する。

6.5.1 色使用に関する備考

色は, 文書に多くの情報量を付加でき,文書をさらに読み易くすること ができるが,文書に色を含める場合には,次の指針を考慮すること。

6.6 長さ

HTMLは, 属性に関する長さの値の三つの型を, 次のとおり指定する。

長さの値は, 大文字及び小文字を区別しない

6.7 内容型(MIME型)

備考 [RFC2045]及び[RFC2046]の中で定義される"メディア型"は, リンクされた資源の性質を規定する。この標準情報(TR)では, 現在の使用法に従って"メディア型"ではなく"内容型"という語を採用する。 さらに,この標準情報(TR)の"メディア型"は,利用者エージェントが文書をレンダリングするメディアのことを言ってもよい。

この型は,DTDの中で%ContentType; によって表現される。

内容型は, 大文字及び小文字を区別しない

内容型の例は, "text/html", "image/png", "image/gif", "video/mpeg", "audio/basic", "text/tcl", "text/javascript"及び"text/vbscript"を含む。登録済みMIME型の現在のリストについては, [MIMETYPES] を参照されたい。

備考 内容型 "text/css"は, 現在IANAで登録されていないが, リンクされた資源が[CSS1]スタイルシートであるときに用いなければならない。

6.8 言語コード

型が言語コード(DTDでは%LanguageCode)である属性の値は, [RFC1766]の第2節で指定されるとおり, 言語コードを参照する。HTMLでの言語コードの指定に関する情報については, 言語コードの節を参照されたい。 言語コードの中では, 空白を用いることはできない。

言語コードは, 大文字及び小文字を区別しない

6.9 文字符号化

"charset"属性(DTDでは%Charset)は, 文字符号化の節で定義する文字符号化を参照する。 値は, IANA登録簿(完全リストについては[CHARSETS]を参照)からの文字列(例えば, "euc-jp")でなければならない。

文字符号化の名前は, 大文字及び小文字を区別しない

利用者エージェントは,外部資源の文字符号化を決定するには, 文字符号化の指定の節で示すステップに従わなければならない。

6.10 単一文字

文書文字集合から単一文字を呼び出す 属性もある。 これらの属性は, DTDの中で%Character型をとる。

"&"などの文字参照を用いて, 単一文字を指定してもよい。

6.11 日時

[ISO8601]は, 日付及び時刻の表現における多くのオプション及び変形を許容している。現規定は, 正当な日時の文字列(DTDの中では, %Datetime)の定義のために,プロファイル[DATETIME]の中に規定される書式の一つを使用する。

その書式を次に示す。

  YYYY-MM-DDThh:mm:ssTZD
ここで,
     YYYY = 4桁の年
     MM   = 2桁の月 (01=1月 など)
     DD   = 2桁の日 (01〜31)
     hh   = 2桁の時 (00〜23) (am/pm は使わない。)
     mm   = 2桁の分 (00〜59)
     ss   = 2桁の秒 (00〜59)
     TZD  = タイムゾーン指示子

タイムゾーン指示子は, 次の一つとする。

Z
UTC(協定世界時)を示す。"Z"は, 大文字でなければならない。
+hh:mm
UTCよりhh時間mm分進んでいる現地時間を示す。
-hh:mm
UTCよりhh時間mm分遅れている現地時間を示す。

ここで示された構成要素は, 厳密にこの句読点を伴って存在しなければならない。[ISO8601]に規定されるとおり, 時間要素の開始を示すために, 文字列の中に"T"が現れる(必ず大文字)ことに注意されたい。

アプリケーションの生成が秒までの時間を知らなければ,秒(必要であれば, 分及び時)については値"00"を使用してもよい。

備考 [DATETIME] は, 閏秒の課題に言及しない。

6.12 リンク型

文書作成者は, 次の認識された リンク型を 使用してよい。ここにリストされているリンク型は, 従来の解釈をもつ。 DTDの中では, %LinkTypesは, スペースで分離された, リンク型のリストを参照する。空白文字は, リンク型では使用できない。

これらのリンク型は, 大文字及び小文字を区別しない。つまり, "Alternate"は, "alternate"と同じ意味をもつ。

利用者エージェント, 検索エンジンなどは,さまざまな方法でこれらのリンク型を解釈してよい。例えば,利用者エージェントは, ナビゲーションバーによって, リンクされた文書へのアクセスを提供してよい。

Alternate
リンクが現れる文書について, 代替版を指定する。lang属性と共に使用する場合は,文書の翻訳版を意味する。 media属性と共に使用する場合は, 別のメディア(単数又は複数)のために設計された版を意味する。
Stylesheet
外部のスタイルシートを参照する。詳細については, 外部スタイルシートの節を参照のこと。これは,利用者が選択できる代替スタイルシートに関して, リンク型"Alternate"と共に使用される。
Start
文書の集合における最初の文書を参照する。このリンク型は,検索エンジンに, どの文書が集合の開始点であると文書作成者が考えるかを伝える。
Next
文書の線形シーケンスにおける次の文書を参照する。利用者エージェントは,"次"文書を予めロードする選択をして,見かけのロード時間を節約できる。
Prev
文書の順序付けされた連続の中で, 前の文書を参照する。同義語"Previous"もサポートする利用者エージェントもある。
Contents
目次として扱われる文書を参照する。同義語ToC("Table of Contents"に基づく。)もサポートする利用者エージェントもある。
Index
現文書に関する索引を提供する文書を参照する。
Glossary
現文書に関する用語集を提供する文書を参照する。
Copyright
現文書の著作権表示を参照する。
Chapter
文書集合の中で章として扱われる文書を参照する。
Section
文書集合の中で節として扱われる文書を参照する。
Subsection
文書集合の中で副節として扱われる文書を参照する。
Appendix
文書集合の中で付録として扱われる文書を参照する。
Help
ヘルプ(もっと詳細な情報,他のソース情報へのリンクなど)を提供する文書を参照する。
Bookmark
しおりを表す。しおりは, 拡張された文書内の主要入力ポイントへのリンクとする。例えば, title属性は, しおりにラベル付けするために使用してよい。 各文書の中で定義できるしおりもあることに注意されたい。

文書作成者は,この標準情報(TR)で規定されない 付加的リンク型を定義することを望んでもよい。付加的リンク型を定義しようとする場合,文書作成者は, プロファイルを使用して, リンク型を定義するために使用する規約を引用するほうがよい。詳細については, HEAD要素のプロファイル属性を参照のこと。

リンク型に関する詳細については, HTML文書のリンクに関する節を参照されたい。

6.13 メディア記述子

認識されたメディア記述子(DTDでは, %MediaDesc)のリストを次に示す。

screen
ページ化されていないコンピュータ画面を意図する。
tty
テレタイプ,端末装置,限定表示機能をもつ携帯装置などの, 固定ピッチの文字格子を使用するメディアを意図する。
tv
(低解像度,カラー,限定スクロール機能の)テレビ型装置を意図する。
projection
プロジェクタを意図する。
handheld
(小画面,モノクローム,ビットマップ図形,限定帯域幅の)ハンドヘルド装置を意図する。
print
ページ化した不透明なもの, 及び印刷プレビューモードで画面にに表示された文書を意図する。
braille
点字触覚フィードバック装置を意図する。
aural
音声合成器を意図する。
all
すべての装置に適する。

HTMLの将来版は, 新しい値を導入し,パラメタ化した値を使用してよい。これらの拡張の導入を容易にするために, 適合する利用者エージェントは, media属性値を次のとおり構文解析できなければならない。

備考 スタイルシートは, その中のメディア依存の変形(CSSの@media構成子など)を含む。 この場合, "media=all"の使用は, 適切であろう。

6.14 スクリプトデータ

スクリプトデータ(DTDの中では, %Script; )は, SCRIPT要素の内容, 及び組込みイベント属性の値であり得る。 利用者エージェントは, HTMLマーク付けとしてスクリプトデータを評価してはならない が,その代わりデータとしてそれをスクリプトエンジンに渡さなければならない。

スクリプトデータの大文字及び小文字の区別は, スクリプト言語に依存する。

要素内容であるスクリプトデータは, 文字参照を含めないが, 属性の値であるスクリプトデータは, それらを含んでよいことに注意されたい。附属書は, 非HTMLデータの指定 について,さらに詳しい情報を提供する。

6.15 スタイルシートデータ

スタイルシートデータ(DTDでは, %StyleSheet;)は, STYLE要素の内容, 及びstyle属性の値であり得る。利用者エージェントは, スタイルデータをHTMLマーク付けとして評価してはならない。

スタイルデータの 大文字及び小文字の区別は, スタイルシート言語に依存する。

要素内容であるスタイルシートデータは, 文字参照を含めないが, 属性の値であるスタイルシートデータは, それらを含んでよいことに注意されたい。 附属書は, 非HTMLデータの指定 について, さらに詳しい情報を提供する。

6.16 フレームターゲット名

次にリストする予約済みの名前を除き, フレームターゲット名(DTDでは, %FrameTarget;)は, アルファベット文字(a〜z A〜Z)で始まらなければならない。 利用者エージェントは, 他のターゲット名をすべて無視することが望ましい。

次のターゲット名は予約され, 特別の意味をもつ。

_blank
利用者エージェントは,新しい名前のないウィンドウの中に指示される文書をロードするのが望ましい。
_self
利用者エージェントは,このターゲットを参照する要素と同じフレームの中の文書をロードするのが望ましい。
_parent
利用者エージェントは,文書を現フレームの直接のFRAMESETの親にロードするのが望ましい。 現フレームが親をもたない場合は,この値は_selfと等価とする。
_top
利用者エージェントは,完全な元のウィンドウに文書をロードするのが望ましい。 そのため他のフレームをすべて中止する。現フレームが親をもたない場合は,この値は _selfと等価とする。