2003年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (パナソニックコミュニケーションズ(株))

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.議長は, J. Mason(US).9ヶ国のPメンバと6ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: C. Goldfarb(US)
SGMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(情報表示) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: S. Pepper(Norway)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

国内では, 20名の委員で構成されるSC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.2004年2月にSC34/WG1小委員会を設立し, 6名の委員が主としてトピックマップに関する技術検討を行っている.

1.2 国際会議と参加状況

SC34総会およびWG1, WG2, WG3会議(2003年05月03日〜07日,ロンドン, UK):
8ヶ国から24名(日本から4名)が参加した.
SC34/WG3会議(2003年08月01日〜04日,モントリオール, カナダ):
4ヶ国から7名(日本から1名)が参加した.
SC34総会およびWG1, WG2, WG3会議(2003年12月06日〜11日,フィラデルフィア, USA):
10ヶ国から29名(日本から7名)が参加した.
TR 9573-11(規格文書のDTD) 第2版 エディタ会議(2004年04月30日,ジュネーブ, スイス):
ISO/CSから3名, 日本から4名が参加した.
TR 9573-11(規格文書のDTD) 第2版 エディタ会議(2004年11月10日,ジュネーブ, スイス):
ISO/CSから2名, 日本から2名が参加した.

1.3 投票等

FDIS投票 1件
(FDIS 19757-2)
FDAM投票 1件
(FDAM1 to ISO/IEC 10179)
CD投票 1件
(CD 13250-2)
PDTR投票 1件
(PDTR 9573-13 2nd ed.)
PDAM投票 3件
(PDAM2 to ISO/IEC 10179, PDAM1 to TR 19758, PDAM2 to TR 19758)
NP投票 1件
(NP for TR 9573-13 2nd ed.)
規格出版 4件
(ISO/IEC 13250 2nd ed., ISO/IEC 19757-2, ISO/IEC 15445 cor. ver., Amd.1 to ISO/IEC 10179)

1.4 国際委員会の主な変更点および変更理由

USからカナダへのセクレタリアートの変更に関する投票(JTC1 N7125)が2003年9月に承認され, カナダのKen Holmanがセクレタリアート業務を行うことになった.

1.5 日本担当のエディタの変更

2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2003年度に進捗があったパートの動向等を次に示す.

a) パート2 (Regular-grammar-based validation -- RELAX NG)

2002年12月に作成されたFDISテキストに対する投票がなかなか開始されず, ITTFの事務処理が問題となったが, ようやく2003年10月を期限とするFDIS投票が行われた.11月のTable of replyで承認が示され, 12月に国際規格として出版されたが, この出版処理は異常と思えるほど早かった.

その後, 正規文法に基づく妥当性検証(regular-grammar-based validation)用の別の記法としてRELAX NGコンパクト構文を規定したいという要求が提出され, それを附属書(規定)としてパート2に追加するAmd.の開発が開始された.

b) パート4 (Namespace-based Validation Dispatching Language)

TR 22250-2(RELAX Namespace)をDSDLの体系に整合させたこのパート4の内容に関するWG1での議論を反映したCDテキストは, 昨年度末のCD投票によって承認(賛成7, 反対1)され, 2003年5月の会議で投票コメント対処を承認した.その後, 名前空間ルーティング言語をパート4に追加することが要求され, 2003年12月の会議でそれに合意して, 改訂文書をFCD投票にかけることになった.しかしFCDの手続きは進んでいない.

この間, このパート4は次のようにその表題を変えている.
- Selection of Validation Candidates [SC34 N415: Disposition of CD comments (2003-05-07)]
- Namespace-based Validation Candidate Selection [SC34 N464: WG1 recommendation (2003-12-7)]
- Namespace-based Validation Dispatching Language [Secretariat Manager's Report (2004-03-29)]

c) パート1 (Overview)

昨年度末の2回目のCD投票によって承認(反対なし)され, 2003年5月の会議で投票コメント対処を承認した.この会議で, 以前のパート0がパート1に改められ, それに対応して以前のパート1(Interoperability Framework)がパート10(Validation Management)に改められた.パート10の表題は, その後Validation Frameworkに変更されている.

CD投票コメント対処を反映したパート1の改訂テキストは, まだ配布されていない.

d) パート5 (Datatypes)

データ型に関する素案への反対意見が強く, さらに検討を継続している.日本は, エディタの素案とは独立に, 携帯端末用のデータ型の必要性を主張して, XMLスキーマのデータ型の部分集合を提案(SC34 N410)した.さらに日本からの関連活動として, パート2の検証器から利用するための和暦データ型を提案し, 実装例を公開した.

データ型に対する多様な要求に対応するため, データ型を登録するための登録手続きの標準化を日本は提案したが, 2003年12月の会議では, データ型ライブラリ言語を拡張可能なデータ型ライブラリを定義するための基礎として用いたパート5の編集をエディタに指示することにした.

(2) 規格文書の構造記述とスタイル指定 (ISO/IEC TR 9573-11 第2版)

昨年度末にジュネーブで開催されたエディタ会議で, このDTRコメント対処文書に従って出版用の最終文書が作成され,SC34セクレタリアート経由でJTC1からITTFに提出されたが, その後のISO/CSによる規定内容のレビューと修正に1年近くを要した.その間にさらに2回のエディタ会議をジュネーブで行い, 最終校正結果に対するISO/CSとエディタとの議論が終結したのは, 2004年3月であった.(出版は2004年4月8日.)

最終段階で多くの時間がかかったひとつの理由は, ジュネーブのEmailシステムの不安定さであり, ISO/CSから日本のエディタとJTC1とに送られたはずのEmailが紛失する事故が複数回発生した.もうひとつの理由は, このTRが規格文書の論理構造記述とそれに対するスタイル指定とを規定するものであるにもかかわらず, ISO/CSはスタイル指定を実行したレンダリング処理系の出力にレビューの対象が集中し, このTRの対象外であるレンダリング処理系の問題にコメントが集中したことにある.

多くの時間をかけた規定ではあるが, 必ずしも多くの規格文書データについて実際の処理系でこの規定内容を確認してはいないため, 今後は実際の処理系での検証結果をCor.またはAmd.によって規定内容に反映していく必要があろう.

2.2 WG2(情報表示)

(1) DSSSLライブラリ(ISO/IEC TR 19758)のAmd.

DSSSLライブラリは, SGML(ISO 8879)又はXMLで記述された複雑な構造化文書に対して, DSSSLを用いてフォーマット指定を行う場合に用いるDSSSLライブラリを提供する.このライブラリを用いることによって, DSSSL及び組版に関する専門的な知識を必要とせずに, フォーマットのDSSSL指定を行うことを可能にする.日本からのFast-track手続きによるのTRは, 2003年3月末に出版されたが, このライブラリの内容に対して, 多くの追加要求が出され, Amd.のための作業が開始された.

Amd.1は, 表組に関するスタイル指定ライブラリを追加し, 基本組体裁を拡張する.表組の規定内容は, 標準情報TR X 0010追補1に基づき, 基本組体裁の拡張は, 日本規格協会の情報技術標準化研究センター(INSTAC)における電子出版技術調査研究委員会の2002年度の調査研究に基づく.PDAM1テキストは, 2004年12月にSC34に提出され, 2004年3月期限のPDAM投票で承認された.

Amd.2は, 東南アジアの文書で用いられるスタイル要素をライブラリに追加する.これらのスタイル要素提案は, 国際情報化協力センター(CICC)のDocSIIプロジェクトの現地調査によってその利用者要求が明らかにされ, INSTACにおける電子出版技術調査研究委員会の調査研究によって記述されたライブラリに基づく.PDAM2テキストは, 2004年12月にSC34に提出され, 2004年3月期限のPDAM投票で承認された.

Amd.3は, 南アジアおよび北アジアの文書で用いられるスタイル要素をライブラリに追加する.これらのスタイル要素提案は, 国際情報化協力センター(CICC)のDocSIIプロジェクトの現地調査によってその利用者要求が明らかにされ, INSTACにおける電子出版技術調査研究委員会の調査研究によって記述されたライブラリに基づく.作業ドラフトが, 2004年12月にSC34に提出された.

(2) DSSSL(文書スタイル意味指定言語, ISO/IEC 10179)のAmd.

Amd.1は, マルチメディア文書に対応して, DSSSLの流し込みオブジェクトクラスを拡張し, 領域(area)を拡張する.実装を容易にするために, グローブ設計, SGML特性集合などを整理して附属書として追加している.このFDAM1に対する投票は, 2003年7月を期限として行われた.

この投票の結果を待たずに, ITTFは5月にFDAMテキストの校正をエディタに求め, 出版作業の前倒しを要求してきたので, それへの対応を行った.FDAM投票結果は反対なしで承認となったが, カナダとUKからのコメントがあり, ITTFと相談の上, 最終テキストへの反映を行った.

さらに複雑な文書スタイルおよび多言語文書への拡張をサポートするためのAmd.2については, 2003年5月の会議でプロジェクトが承認され, 2003年12月にPDAMテキストが提出された.これは2004年3月期限のPDAM投票で承認された.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ, ISO/IEC 13250) 2nd ed.

当初, Cor.1(2001年10月に承認)に基づいて進められていたISO/IEC 13250の修正作業は, 昨年度の報告に示したとおり, このCor.1を含んだテキストISO/IEC 13250 2nd editionの作業に切替えられ, 昨年度末にその校正作業が行われた.これは, 2003年5月に, ISO/IEC 13250 2nd ed.として出版された.

(2) TM(トピックマップ, ISO/IEC 13250) マルチパート

トピックマップの規格を再構成して次の機能を含め, TM規定のマルチパート化を図る新作業課題が提案され, 昨年度末にNP投票が行われた.

日本は賛成投票を行い, エディタ候補を推薦した.投票の結果, このNPは承認(SC34 N388rev)され, 2003年5月の会議で次の課題の作業内容が明らかにされた(SC34 N423).
- ISO 13250-1 トピックマップ -- 概要および基本概念
- ISO 13250-2 トピックマップ -- データモデル
- ISO 13250-3 トピックマップ -- XML構文

2003年12月の会議では, これまで独立した課題として議論されてきた正準XML構文を次のとおり, パート4に位置付けている.
- ISO 13250-4 トピックマップ -- 正準XML構文

パート2は, 2004年1月を期限とするCD投票で承認(賛成7, 反対1)された.2003年度末までにパート3および4に関して, CDテキストが配布され, 投票が開始されている.

(3) TMQL(トピックマップ問合せ言語, ISO/IEC 18048)

利用者要求とuse caseに関する文書(それぞれSC34 N448, N449)が提出され, その改訂作業が進行中である.問合せ言語として3案(tolog, AstMa, and TMPath)が提案され, TMQLメーリングリスト上で検討が続けられている.

(4) TMCL(トピックマップ制約言語, ISO/IEC 19756)

利用者要求がまとめられ(SC34 N405), 2003年12月の会議での議論を反映した新テキストの作成が進められている.

(5) TMRM(トピックマップ参照モデル)

参照モデルのUse Caseの検討が行われ, それを参照モデルの議論の開始点として, 他の知識表現との関係を規定する計画が進められている.

(6) HTML(ハイパテキストマーク付け言語, ISO/IEC 15445 corrected version)

Cor.1(2001年11月に承認)に基づいて進められていたISO/IEC 15445の修正作業は, このCor.1を含んだテキストISO/IEC 15445 corrected versionの作業に切替えられ(SC34 N424に, エディタとISO/CSとの相談によって処理されたことが示されている.), 2003年5月に出版された.

3. その他

日本規格協会の情報技術標準化研究センター(INSTAC)における"文書処理及びフォントの標準化調査研究委員会(DDFD)"は, SC34で開発された国際規格を系統的に調査し, 必要に応じて翻訳して原規格に一致する国内規格を作成してきた.この委員会は, 2002年度でその活動を終了した.2003年度には, INSTACでの非公式な活動として, SC34関連の国内規格の検討が行われた.