World Wide Web (ウェブ)は, 情報資源のネットワークであって, 極めて広範囲に及ぶ可能な利用者に対して, これらの資源を利用可能にするための次の三つの機構に依存する。
三つの機構の結び付きは, この規定の中で明示される。
HTML文書,画像,ビデオクリップ,プログラムなどの,ウェブ上で利用できるすべての資源は, 全域資源識別子又は "URI"によって符号化できるアドレスをもつ。
URIは, 次の三部分によって構成される。
現HTML規定を指定する次のURIについて考えよう。
http://www.w3.org/TR/REC-html40/
このURIは, 次のとおりに解釈できる。つまり, HTTPプロトコル([RFC2068]参照)によって利用できる文書が存在し, それは www.w3.orgという機械上にあり, "/TR/REC-html4/"というパスでアクセスできる。 HTML文書で見ることができる別の方式は, 電子メール用の"mailto"及びFTP用の"ftp"を含む。
URIのもう一つの例を次に示す。この例は, 利用者のメールボックスを参照する。
...this is text... For all comments, please send email to <A href="mailto:joe@someplace.com">Joe Cool</A>.
備考 "URL"という言葉はよく知られているが, "URI"という言葉はあまり知られていない。URLは, もっと一般的なURI 命名方式の部分集合となる。
資源内の位置を参照するURIもある。この種のURIは,"#"の後ろに素片識別子と呼ぶアンカ識別子が続くもので終わる。例えば,section_2と名付けられたアンカにポイントするURIを次に示す。
http://somesite.com/html/top.html#section_2
相対URIは, 命名方式の情報を含まない。 そのパスは, 一般に現文書と同じ機械の上の資源を参照する。 相対URIは, 相対パス構成要素を含んでよい。例えば ".." はパスによって定義される階層における一段階上を意味する。 相対URIは, 素片識別子を含んでもよい。
相対URI は 基本URIを用いた完全URIに解決される。 相対URI解決の例として, 基本URI "http://www.acme.com/support/intro.html"があるとしよう。 ハイパテキストリンクのためのマーク付け
<A href="suppliers.html">Suppliers</A>
における相対URIは, 完全URI"http://www.acme.com/support/suppliers.html"に展開され, 画像のマーク付け
<IMG src="../icons/logo.gif" alt="logo">
における相対URIは, 完全URI "http://www.acme.com/icons/logo.gif"に展開される。
HTMLにおいて, URIは次の目的で用いられる。
URIに関する詳細情報については, URI型の節を参照されたい。
大域的配布用の情報を公開するためには, すべてのコンピュータが理解できる可能性のある一種の公開母語である, どこでも理解される言語が必要となる。World Wide Webで使用される公開言語 をHTML(ハイパテキストマーク付け言語)とする。
HTMLは, 文書作成者に対して次の目的をもつ手段を与える。
HTMLは, 最初は CERNでのTim Berners-Leeによって開発され, NCSAで開発されたMosaicブラウザによって一般化した。 1990年代において,HTMLはウェブの爆発的な拡大とともに発展した。この間,HTMLは数多くの方法で拡張された。 ウェブは, HTMLの同一規約を共有するウェブページの文書作成者及びベンダに依存する。 これはHTMLの規定を共同で作業するきっかけとなった。
HTML 2.0 (1995年11月, [RFC1866]参照) は, インタネット技術タスクフォース(IETF)の後援の下で開発され,1994年の後半に共通の実施項目を編纂した。 HTML+ (1993)及びHTML 3.0 (1995, [HTML30]参照) は, HTMLのさらに充実した版を提供した。規格の議論ではコンセンサスが 得られなかったが,これらの原案は,新しい機能範囲の採用を導いた。 World Wide Web コンソシアムのHTML作業グループの努力によって, 1996年に共通の実施項目が編纂され, HTML 3.2となった(1997年1月, [HTML32]参照)。HTML 3.2からの変更は, 附属書Aに要約されている。
HTML文書が異なるブラウザ及びプラットフォームにわたって良好に動作するのが望ましいことは誰もが認めている。内容提供者が開発しなければならないのは文書の一つの版だけであるため,この相互運用性の達成は,内容提供者に対してコストを削減する。この努力がなければ,はるかに大きなリスクが生じることになる。つまり,ウェブは非互換な固有フォーマットの世界に陥り,すべての関係者にとっての ウェブの商業的な可能性を減じることになる。
HTMLのどの版も, 業界関係者間のより大きなコンセンサスを反映し, 内容提供者による投資が無駄にならず,文書が短期間で 読み取れなくならないことを意図されている。
HTMLは,あらゆる種類の装置がウェブ上で情報を使用できるのが望ましいという視点で開発された。つまり,解像度及び色分解を変える図形ディスプレイを備えたPC, セルラー電話,ハンドヘルド装置,入出力用の音声装置,広帯域又は狭域幅のコンピュータなどを想定している。
HTML 4.0は, スタイルシート,スクリプト,フレーム,埋込みオブジェクト, 左向きテキスト及び混在方向テキスト,多機能な表, 並びに拡張フォームのための機構を備え,身障者に対する高機能アクセス可能性を提供して, HTMLを拡張する。
HTMLのこの版は,国際化の分野における専門家の助力を得て設計された。したがって 文書はあらゆる言語で書くことができ,容易に世界中に送ることができる。 これはHTMLの国際化を扱う[RFC2070]を組み込むことによって達成された。
一つの重要なステップは, HTML用の文書文字集合としてISO/IEC 10646規格([ISO10646]参照)の採用 であった。これは,国際的な文字,テキスト方向,句読点の表示の問題 及びその他の世界の言語の問題を扱う世界的に最も包括的な規格である。
現在のHTMLは,文書中の多様な自然言語に関して高度なサポートを提供する。 これによって,検索エンジンのための文書の効率的な索引付け,印刷技術の品質, テキスト-音声変換,ハイフン処理などがさらに高度化する。
ウェブ共同体が拡大し,そのメンバの能力及び技術が多様化するため, 基本技術をそのメンバ固有のニーズに対して適切なものにすることは難しい。 HTMLは, 身体的制約をもつ者にとってウェブページへのアクセス可能性を高めた設計がなされている。 アクセス可能性についての配慮によって生じたHTML4.0の開発項目を,次に示す。
アクセス可能性の問題を念頭においてページを設計する文書作成者は, アクセス可能性共同体の恩恵を受けるだけでなく,他の方法でも利益を得る。 即ち,構造と表示とが区別された優れた設計のHTML文書は,新しい技術に容易に順応する。
備考 アクセス可能HTML文書の設計に関してより多くの情報を入手したい場合は, [WAIGUIDE]を 参照のこと。
HTMLにおける新しい表モデルは, [RFC1942]に基づく。現在,文書作成者は, 列集合などの構造及びレイアウトを強く制御する。推奨の列幅を用いると,利用者エージェントは, レンダリング の前に完全な表を待つのではなく,(データの到着に応じて)増加的に表データを表示することができる。
備考 HTML作成の時点で,フォーマット化のために表(の利用)に大きく依存するHTML文書作成ツールもあるが,これは容易にアクセス可能性の問題を引き起こすことがある。
現在のHTMLは,共通のメディアオブジェクト及びアプリケーション をHTML文書に組み込むための標準的な機構を提供する。 OBJECT要素は(もっと固有性の高い先祖要素 IMG及びAPPLETと共に),画像,ビデオ,音,数式, 特定アプリケーション,及びその他のオブジェクトを文書中に包むための機構を提供する。 それは,文書作成者が, 固有のレンダリングをサポートしない利用者エージェント のために代替レンダリングの階層を指定することを可能にする。
スタイルシートはHTMLマーク付けを簡単にし,表示の責任からHTMLをかなり軽減する。スタイルシートは,文書作成者及び利用者のどちらに対してもフォント情報,配置,色 など文書表示の制御を与える。
スタイル情報は, 個々の要素又は要素の集合に対して指定できる。スタイル情報は, HTML文書の中で又は外部のスタイルシートで指定してよい。
スタイルシートを文書と関連付ける機構は, スタイルシート言語に依存しない。
スタイルシートが現われる前は,文書作成者は, レンダリングに関して制限付きの制御をもっていた。 HTML3.2は,配置,フォントサイズ及びテキスト色の制御を提供する多くの属性及び要素をもつ。文書作成者は, ページをレイアウトする手段として, 表及び画像をも利用した。利用者がブラウザをグレードアップするのに比較的長時間かかるのは,これらの機能がしばらく使用され続けることを意味する。しかし,スタイルシートがもっと強力な表示機構を提供するため, World Wide Webコンソシアムは, HTMLの表示の要素及び属性の多くを結局除去するであろう。 この規定の中では,リスクのある要素及び属性は, "推奨しない"とマーク付けされて いる。それに例を付記して, 他の要素又はスタイルシートを用いてどのように同じ効果を得るかを示す。
スクリプトによって, 文書作成者は, 利用者が記入を終えると反応する“スマートフォーム”などの動的なウェブページを作成でき,ネットワーク化アプリケーションを構築する手段としてHTMLを使用してもよい。
HTML文書の中にスクリプトを包むために提供される機構は,スクリプト言語に依存しない。
文書作成者は,利用者が現在の文書よりもたくさん印刷することを容易にしたいと考えることがある。文書がもっと大きな作業の一部を形成するとき,それらの関係は, HTML LINK要素, 又はW3Cの資源記述の枠組み(RDF)を用いて記述できる([RDF]参照)。
文書作成者及び実装者は,HTML4.0を使用して作業をするとき,次の 一般原則を守ることを推奨する。
HTMLの起源は,常に構造的マーク付けの規定に関する言語であったSGMLにある。 HTMLが成熟すると,表示に関する要素及び属性は, 徐々に他の機構,特にスタイルシート に置き換えられる。経験は, 文書の構造をその表示に関する観点から分離することが 広範囲なプラットフォーム,メディアなどを扱うコストを削減し, 文書の改訂を容易にすることを示している。
誰に対しても,特に障害をもつ人に対してもウェブのアクセス可能性を高めるために,文書作成者は,その文書が音声ベースのブラウザ,点字リーダなどの多様なプラットフォーム上でどのようにレンダリングされるかを配慮することが望ましい。 文書作成者がその創造性を制限することを推奨するのではなく,文書作成者がその設計において代替レンダリングを配慮することを推奨するだけである。 HTMLは,この規定の末尾に,alt属性, accesskey属性などの多くの機構を提供する。
さらに文書作成者は, 彼らの文書が多様なコンピュータ構成で遠隔地の閲読者にも達していることを忘れないほうがよい。文書が正確に解釈されるために,文書作成者は, 自然言語及びテキストの方向についての情報,文書の符号化の方法, 並びに国際化に関連するその他の課題を彼らの文書の中に含めることが望ましい。
HTML4.0で注意深く表を設計し,新しい表機能を用いることによって, 文書作成者は, 利用者エージェントが文書をもっと素早くレンダリングするのを支援できる。 文書作成者は, 増加的レンダリング(TABLE要素参照)のための表設計の方法を知ることができる。実装者は,増加的アルゴリズムに関する情報については附属書の表に関する備考を参照することが望ましい。