TOP | BACK | FORW


5. XML日本語プロファイル

5.0 背景



XMLは,符号化文字集合としてJIS X 0221及びUnicode 2.0を採用しており,これは日本語文字をすべて含む.文字符号化スキームとしてはUTF-8及びUTF-16を推奨し,これらの実装を義務付けている.既存の文字符号化スキームも,Unicode 2.0の文字だけを扱う限りオプションとしてすべて許容している.

しかし,XMLの勧告では,日本語文字の交換に広く使われてきた既存の文字符号化スキームはほとんど説明されてなく,オプションの一つとして許容されているに過ぎない.SMTP及びHTTPなどのプロトコル並びに情報交換用ファイルで,どの文字符号化スキームを用いるかについても,特に定められてはいない.

既存の文字符号化スキームとJIS X 0221及びUnicode 2.0との対応も不明確である.相互に異なるいくつかの変換表が用いられており,複数のXMLプロセサが異なる結果を出力する場合がある.


TOP | BACK | FORW