この標準情報(TR)は,日本規格協会 情報技術標準化研究センター(INSTAC)に設立された高速Web環境における標準化に関する調査研究委員会で,1998年度に行われた高速Web言語の調査研究をもとに,工業標準化の促進に関連して特に重要と判断される技術情報をまとめ,標準情報(TR)(タイプU)として公表するものである。
この標準情報(TR)は,日本語文字を含むXML文書に関しての明確化を行って, [TR X 0008]を補足する。
備考 この標準情報(TR)では,[JIS X 0208]及び[JIS X 0212]の図形文字を,平仮名,片仮名,ラテン文字などの非漢字も含めて"漢字"と呼ぶ。これらの漢字と [JIS X 0201]の片仮名用図形文字,円記号,オーバラインとを合わせて"日本語文字"と呼ぶ。
日本語文字を含むXML文書の交換性を高めるため,この標準情報(TR)は文字符号化スキームについての規定を行う。情報交換用ファイルで使用する文字符号化スキーム,各種のプロトコル(SMTP, HTTP/1.1など)で使用する文字符号化スキームは, それぞれ別に規定する。文字符号化スキームから[JIS X 0221]及び[Unicode 2.0]への変換に用いられている変換表を列挙し,符号化宣言及びMIMEヘッダで指定する名称を個々の変換表に与える。
備考 この標準情報(TR)では,"符号化文字集合"という語を,[IETF RFC 2130]で定義されている"Coded Character Set"と同じ意味で用い,"文字符号化スキーム"という語を,同じく[IETF RFC 2130]で定義されている"Character Encoding Scheme"と同じ意味で用いる。
参考 交換性が保証されないことを了解した上で,これらの規定を無視するのは利用者の自由である。
この標準情報(TR)にある規定の一部は,IETF RFC及びW3C勧告にある規定を日本語文字に当てはめて分かりやすく言い直したものであって,独自の規定ではない。
参考 例えば,[TR X 0008]は"[Unicode]の6.8節で定義される互換性文字は使用を避けることが望ましい。"と規定している。[JIS X 0201]の片仮名用図形文字は,この互換性文字にあたるため,この標準情報(TR)では[JIS X 0201]の片仮名用図形文字を避けることが望ましいと規定している。
独自の規定ではなく,[TR X 0008]並びにその他のIETF RFC及びW3C勧告にある規定を日本語文字に当てはめて言い直した規定は,参考又は解説において元の規定を示す。
以降 省略