日本工業規格

JIS X 4156:2000    
(ISO/IEC 15445:2000)

ハイパテキストマーク付け言語 (HTML)

HyperText Markup Language (HTML)



序文

この規格は, 2000年に第1版として発行されたISO/IEC 15445 [Information Technology — Document Description and Processing Languages — HyperText Markup Language (HTML)]を翻訳し,技術的内容を変更することなく作成した日本工業規格である。


0. 導入

ハイパテキストマーク付け言語(HTML)は, ISO 8879 標準一般化マーク付け言語(SGML)の応用とする。HTMLは, ハイパテキスト文書を構造化し, 文書中に別の文書を指す参照情報を置くための簡単な手段を, 提供する。この規格は, HTML 4.0に関する標準情報TR X 0033[World Wide Web Consortium(W3C)のHTML 4.0勧告に一致]を洗練化している。つまりこの規格は, 安定で成熟した機能の使用を強調し, 認められているSGMLの実行を表現する方法で, W3C勧告の利用を条件付けて洗練化する規則を提供する。この規格に適合する文書は, 標準情報TR X 0033が規定する厳密DTD(strict DTD)にも適合する。

この規格は, 適合システムと検証システムとの区別を明確化し重視する。適合システムは, この規格に適合する文書を扱うときに正しく動作するが, 適合しない文書を扱うときには正しく動作する必要はない。検証システムはもっと強力で, 文書中のSGMLエラー及びHTMLエラーをすべて検出する。ブラウザは適合システムであることが多く, 文書作成ツールは妥当性を検証する。

この規格は, エラー処理手続きを規定しない。

  備考 この規格は, 読者がISO 8879 標準一般化マーク付け言語(SGML)を熟知していること仮定している。読者がSGMLの専門家でない読者は, http://purl.org/NET/ISO+IEC.15445/Users-Guide.html にあるUsers Guide to ISO/IEC 15445を参考にするのもよい。この手引きは, 例えば文書準備過程で使用される, SGMLの技法の入手し易い説明を提供している。


1. 適用範囲

この規格の適用範囲は, ISO 8879のSGMLに適合する応用とする。この規格は, 標準情報TR X 0033の次に示す各節が規定するHTML言語の使用方法を示す。さらに, 標準情報TR X 0033が規定するHTML言語とこの規格が規定するHTML言語とのすべての相違を示すことによって, HTML言語の使用方法を明らかにする。

a2 HTML4.0への導入
b5 HTML文書表現
c6 基本HTMLデータ型 (6.5, 6.14及び6.16を除く。)
d7 HTML文書の大域的構造
e8 言語情報及びテキスト方向
f9 テキスト
g10 リスト (10.4を除く。)
h11 表
i12 リンク
j13 オブジェクト, 画像及びアプレット (13.4及び13.7を除く。)
k14 スタイルシート (14.2.2を除く。)
l15.2.1 フォントスタイル要素(型) (<BIG>[15.2.1], <SMALL>[15.2.1], <STRIKE>[15.2.1], <S>[15.2.1] 及び <U>[15.2.1]の要素(型)を除く。)
m15.3 けい(罫)線 [HR要素(型)]
n17 フォーム
o24 HTML4.0の文字実体参照
p附属書C 文献

1.に示されない標準情報TR X 0033の内容は, すべてこの適用範囲外とする。

  備考 この規格の対応国際規格を次に示す。 なお, 対応の程度を表す記号は, ISO/IEC Guide21に基づき, IDT(一致している), MOD(修正している), NEQ(同等ではない)とする。 ISO/IEC 15445:2000, Information Technology - Document Description and Processing Languages - HyperText Markup Language(HTML) (IDT)


2. 適合性

この規格は, 適合文書, 検証システム, 適合システム, 及び文字集合の適合性を区別する。

2.1 適合文書

この規格に適合する文書は, 次のとおりとする。

a文書型宣言を必ずもち, その後に<HTML>[7.3]文書要素に含まれる文書インスタンスを一つもつ適合HTML文書でなければならない。文書型宣言の前後には空白があってもよい。空白は, RS, RE, SPACE, TAB及びHTMLコメントからなる。
bこの規格の要件に適合しなければならない。

2.2 検証システム

次の条件をすべて満たすHTMLシステムを検証HTMLシステムとする。

aISO 8879の15.4が定義する検証SGML構文解析系をもつ。
bどんな適合HTML文書をも処理できる。
cもしHTMLエラーがあれば, それを検出し報告する。
dHTMLエラーがなければ, それを報告しない。

2.2.1 検証システムのドキュメンテーション

この規格に適合する検証システムは, 次に示す識別テキストを, ドキュメンテーションに用いている国語で次の箇所に目立つ方法で表示しなければならない。

a出版物の前付け(通常は, 表題ページ及び表紙)の目立つ位置
bプログラムの識別表示の上
c促販物及び教材

HTML検証システムの識別テキストは, 次のとおりとする。

国際規格ISO/IEC 15445—ハイパテキストマーク付け言語, 及び国際規格ISO 8879—標準一般化マーク付け言語(SGML)に適合するHTML検証システム。
又は
An HTML validating system conforming to International Standard ISO/IEC 15445—HyperText Markup Language, and International Standard ISO 8879—Standard Generalized Markup Language (SGML).

  備考 検証システムの識別テキストの著作権は, ISO/IECが保持しているが, 特にISO/IECの承諾なしに又はISO/IECの参照なしに使用してもよい。

2.3 適合システム

適合HTMLシステムとは, この規格に適合する文書すべてを処理できるHTMLシステムとする。

2.3.1 適合HTMLシステムのドキュメンテーション

適合システムは, 次に示す識別テキストを, ドキュメンテーションに用いている国語で次の箇所に目立つ方法で表示しなければならない。

a出版物の前付け(通常は, 表題ページ及び表紙)の目立つ位置
bプログラムの識別表示の上
c促販物及び教材

HTML適合システムの識別テキストは, 次のとおりとする。

国際規格ISO/IEC 15445—ハイパテキストマーク付け言語に適合するHTMLシステム。
又は
An HTML system conforming to International Standard ISO/IEC 15445—HyperText Markup Language.

ドキュメンテーションは, そのシステムをHTML文書の検証に用いてもよいと主張したり示唆してはならない。

2.4 文字集合の適合性

この規格が提供するSGML宣言は, JIS X 0221 国際符号化文字集合(UCS)の使用を要求する。JIS X 0221は多くの機能を規定しており, 個々の応用に合わせるためにそこから多様な選択を行ってよい。したがって, 2.4で定義するとおり, JIS X 0221への限定した適合性を検討することだけが実際的となる。

限定した適合性のもとでは, 次のことが要求される。

aJIS X 0221で記述された文字を使用するとき, その文字は, JIS X 0221で規定された意味及び符号化表現で実装されなければならない。
b利用者エージェントがサポートする文字集合を用いてサーバが文書を表現できないとき, 代りにサーバは限定した文字集合で文書を配送し, その問題を利用者エージェントに説明するのがよい。
c登録のため又は将来の標準化のために予約された符号位置を使用してはならない。
d登録されたエスケープシーケンスを, JIS X 0221が定義している意味以外で使用してはならない。

JIS X 0221のUTF-1転送様式は, IANAによってISO-10646-UTF-1として登録されているが, JIS X 0221から除かれたので使用してはならない。


3. 引用規格

次に掲げる規格は, この規格に引用されることによって, この規格の一部を構成する。 これらの引用規格のうちで, 発行年を付記してあるものは, 記載の年の版だけがこの 規格の規定を構成するものであって, その後の改正版・追補には適用しない。発効年 を付記していない引用規格は, その最新版(追補を含む)を適用する。

a TR X 0033:2000 ハイパテキストマーク付け言語(HTML) 4.0
(HTML 4.0 Errataによって修正した標準情報TR X 0033の, この規格の適用範囲の節に列挙した節及び小節。)
    備考1 HyperText Matrkup Language (HTML) 4.0 Specification, W3C REC-html40-19980424が, この標準情報(TR)に一致している。
    備考2 この標準情報(TR)は, Errata(規定の既知の誤り)を訂正するために必要な修正と共に現在の版からなる。現在の版では既に幾つかの誤りは訂正されているかもしれないが, この規格が引用する標準情報(TR)は, すべての既知の誤りを訂正しているとする。
    備考3 この標準情報(TR)は, さらに引用規定を含み, その応用を定義する。

b JIS X 4155 ハイパメディア及び時間依存情報の構造化言語(HyTime)
    備考1 ISO/IEC 10744 — Hypermedia/Time-based Structuring Language (HyTime)が, この規格に一致している。
    備考2 JIS X 4155 HyTimeは, HTMLを他のSGML応用のための基本体系として用いることを可能にするために必要な技術を提供する。


4. 定義

この規格では, ISO 8879:1986での定義及び次の定義を適用する。

4.1 ブラウザ, 閲覧ソフトウェア (Browser)
主要機能が文書を利用者に表示することである利用者エージェント。

4.2 文字 (Character)
情報の最小要素。例えば字又は数字。図形文字は関連するグリフをもち, 制御文字は関連する処理セマンティクスをもつ。RFC1866による。

4.3 文字符号化方式 (Character encoding scheme)
変域がオクテット列の集合で, 値域が文字レパートリからの文字列の集合である関数。つまり, オクテット列及び文字列が文字符号化方式を決定する。RFC1866による。

4.4 文字レパートリ (Character repertoire)
文字の有限集合。例えば, 符号化文字集合の値域。RFC1866による。

4.5 符号位置 (Code position)
符号化文字集合の変域の整数。符号化文字集合が符号位置を文字に写像する。RFC1866による。

4.6 符号化文字集合 (Coded character set)
整数の部分集合を変域とし, 文字レパートリを値域とする関数。つまり, 整数の集合(通常は, 0, 1, 2, ..., N-1の形式)に関して, ある符号化文字集合及びその整数の集合内の一つの整数が, 文字を決定する。逆に, ある文字及び符号化文字集合が, 一つ(又は, まれに幾つか)の文字の符号位置を決める。RFC1866による。

4.7 CRLF
ISO 646:1991の2文字CR(13)及びLF(10)がこの順序に並んだ列で, 改行を示す。RFC1521による。

4.8 フォームデータ集合 (Form data set)
名前と値とからなる対の列。名前はHTML文書が与え, 値は利用者が与える。RFC1866による。

4.9 素片識別子 (Fragment identifier)
HREF 属性値の中で, '#'文字の後に続く部分。RFC1866による。

4.10 HTMLブラウザ (HTML browser)
HTML文書を表示するブラウザ。

4.11 HTML文書 (HTML document)
この規格に従って構造化された文書。

4.12 ハイパリンク (Hyperlink)
ソース及びターゲットと呼ばれる二つのアンカの間の関係。リンクはソースからターゲットに向かう。ソースは尾(テイル)とも呼ばれ, ターゲットは飛び先(デスティネーション)又は頭(ヘッド)とも呼ばれる。

4.13 (World Wide Webにおける)利用者エージェント (User Agent)
利用者の入力を受付け, その入力のWorld Wide Webの解釈を利用者に表示するソフトウェア又はハードウェア。

5. 記号及び短縮形

この規格では,次の記号及び短縮形を使用する。

5.1 HTML
HyperText Markup Language (ハイパテキストマーク付け言語)。この規格に関連する。

5.2 HTML 4.0
World Wide Web Consoutiumが開発したHyperText Markup Language (ハイパテキストマーク付け言語)の勧告。

5.3 HTTP
IETF RFC2068のHypertext Transfer Protocol (ハイパテキスト転送プロトコル)。

5.4 IANA
Internet Assigned Numbers Authority (インタネット割当て番号主体)。

5.5 IETF
Internet Engineering Task Force (インタネット技術タスクフォース)。

5.6 RFC
Request for Comments。Internet Engineering Task Forceの公開技術情報。

5.7 SGML
Standard Generalized Markup Language (標準一般化マーク付け言語)。ISO 8879が提供する記法。

5.8 URI
RFC2396が規定するUniform Resource Identifier (統一資源識別子)。

5.9 URL
RFC2396が規定するUniform Resource Locator (統一資源ロケータ)。

5.10 WWW
World Wide Web (ワールドワイドウェブ)。

5.11 W3C
World Wide Webの発展のための共通規格を開発するために, 1994年に制定されたWorld Wide Web Consortium (ワールドワイドウェブコンソシアム)。米国のMassachusetts Institute of Technology Laboratory for Computer Science (MIT/LCS), ヨーロッパのInstitut National de Recherche en Informatique et en Automatique (INRIA), 及びアジアの慶応義塾大学湘南藤沢キャンパスが主催する業界のコンソシアム。

6. 要件

この規格は,次の要件を満たすために設計された。

aSGML応用のための最小の表示体系を提供する。
bHTMLの詳細とSGMLの詳細(SGML宣言,最小化など)との関係を明確にする。
cISOの規格が要求される環境でHTMLを使用可能にする。
d他のSGML応用の基本体系としてHTMLを使用可能にする。
    備考 基本体系としてHTMLを使用するための技法は, JIS X 4155 HyTime が提供する。
eこの規格に適合する文書は, 標準情報TR X 0033(又はその規定の適切な以降の版)に適合するブラウザによって閲覧できる。
f標準情報TR X 0033(又はその規定の適切な以降の版)の有用なサブセットを定義する。


7. 引用規定の利用

この規格が提供する要素型集合は, 標準情報TR X 0033が定義する要素型集合のサブセットになっている。 この規格に含まれる各要素型に関して提供される属性集合は, 標準情報TR X 0033が定義する対応属性集合のサブセットになる。 要素型集合及び属性集合は, この規格が提供するDTDによって定義する。

要素型及び属性に関して改正が定義されているところでは, この規格に適合する文書の集合が,標準情報TR X 0033に適合する文書のサブセットであるという意味において,そのセマンティクスは標準情報TR X 0033が定義するセマンティクスのサブセットになる。

  備考 明確化のため, 及びISO 8879で要求されているとおり, この規格は, 与えられた共通識別子をもつ個々の要素とそれらのすべての要素のクラスとを区別する。このクラスを要素型を呼び, そのインスタンスを要素と呼び, その共通識別子を要素型名と呼ぶ。


8. 一般規定

8.1 バイト順

HTMLテキストをUCS-2又はUCS-4として送信する場合, この規格は, 次を推奨する。

aビッグエンディアンのバイト順(上位バイトが先)に送信する。
b文書は, 常に ZERO-WIDTH NON-BREAKING SPACE文字(16進のFEFF又は0000FEFF)で始まる。これは, バイトが反転していると, FFFE又はFFFE0000となる。この文字は, 決して割り当てられないことが保証されている。


9. 呼出し

この規格が提供するDTDは, 次の公式公開識別子をもつ。

"ISO/IEC 15445:2000//DTD HyperText Markup Language//EN"
"ISO/IEC 15445:2000//DTD HTML//EN"

9.1 文書型宣言

DTDは, 多くの場合次の宣言の一つによって呼び出される。

<!DOCTYPE HTML PUBLIC "ISO/IEC 15445:2000//DTD HyperText Markup Language//EN">
<!DOCTYPE HTML PUBLIC "ISO/IEC 15445:2000//DTD HTML//EN">

文書型宣言は, 文書型宣言のサブセットを含んではならない。

  備考 このDTDは, 適合文書の生成を容易にするオプションの機構を提供する。オプションの機構は, この規格の一部ではなく, SGML構文解析系が, 節の正しい入れ子を検証することを可能にし, Users Guide to ISO/IEC 15445に記述された代替の文書型宣言の使用を必要とする。そのガイドは, ドキュメンテーション生成過程で使用するSGML技法の記述も提供する。

9.2 体系サポート宣言

HTML文書型定義を他のSGML応用の基本体系として使用するために, 次の体系サポート宣言を使用することが望ましい。

<?IS10744 arch name="html"
public-id=
"ISO/IEC 15445:2000//DTD HyperText Markup Language//EN"
dtd-system-id="ftp://ftp.cs.tcd.ie/isohtml/15445.dtd"
renamer-att="HTMLnames"
doc-elem-form="HTML"
>

9.3 DTD中のコメント

"shall"又は"shall not"という表現を用いているDTD中のコメントは, この規格の規定の要件とする。"should"又は"should not"という表現を用いているコメントは, この規格の推奨とする。"recommend"又は"deprecate"という動詞を用いているコメントは, この規格の推奨及び非推奨とする。


10. DTDの入手可能性

公式なSGML定義は, この規格のテキストの一部であり, IETF, W3C(MIT, Inria及びKeio)及びISO/IECの著作権によって保護されている。次の著作権表示をどのコピーにも含めれば, コピーすることの許可が与えられる。

Permission to copy in any form is granted for use with validating and conforming systems and applications as defined in ISO/IEC 15445:2000, provided this copyright notice is included with all copies.


11. スタイル

この規格は, スタイルと内容との完全な分離を要求する。

<STYLE>[14.2.3]要素は, 文書の先頭で, スタイルシートのためのコンテナとして使用してよい。スタイルシート言語は, この規格では規定しない。

この規格が可能な表示を, "ボタンとして"などと記述するときは, スタイル情報は, 要素又は属性のセマンティクスを理解する際の支援を読者に提供することを意図しており, 規定のスタイル要件を意図するものではない。


12. HTMLにおけるコメント

HTML文書中のコメントは, すべてコメント宣言の中に出現しなければならない。コメント宣言毎に厳密に一つのコメントが存在しなければならない。