2004年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (パナソニックコミュニケーションズ(株))

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.議長は, J. Mason(US).9ヶ国のPメンバと8ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: M. Bryan(UK)
SGMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(情報表示) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: S. Pepper(ノルウェー)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

国内では, 21名の委員で構成されるSC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.2004年のはじめからはSC34/WG1小委員会の6名の委員が, 主としてトピックマップに関する技術検討を行っている.

1.2 国際会議と参加状況

SC34総会およびWG1, WG2, WG3会議(2004年04月18日〜20日,アムステルダム, オランダ):
9ヶ国から22名(日本から5名)が参加した.
SC34/WG3会議(2004年07月31日〜08月01日,モントリオール, カナダ):
4ヶ国から8名(日本から1名)が参加した.
SC34/WG1会議(2004年09月18日〜20日,ケンブリジ, UK):
4ヶ国から5名(日本から1名)が参加した.
TMQLエディタ会議(2004年11月05日,東京, 日本):
3ヶ国から6名, 日本から3名が参加した.
SC34総会およびWG1, WG2, WG3会議(2004年11月13日〜17日,ワシントンDC, USA):
7ヶ国から22名(日本から4名)が参加した.

1.3 投票等

FDAM投票 1件
(FDAM2/10179)
DAM投票 2件
(DAM1/TR 19758, DAM2/TR 19758)
FCD投票 1件
(FCD 19757-4)
FPDAM投票 2件
(FPDAM2/10179, FPDAM1/9541-3)
CD投票 5件
(CD 13250-4, CD 13250-3, CD 19757-3, CD 19757-4, CD 19757-1)
PDAM投票 3件
(PDAM1/9541-3, PDAM3/TR 19758, PDAM1/19757-2)
NP投票 1件
(NP/Minimum requirements for specifying document rendering systems)
規格出版 1件
(ISO/IEC TR 9573-11 2nd ed.)

1.4 国際委員会の主な変更点および変更理由

WG1,WG2およびWG3のコンビナとして,それぞれMartin Bryan(英),小町(日本)およびSteve Peppert(ノルウェー)が選出され,SC34としてその結果を承認した.

1.5 日本担当のエディタの変更

ISO/IEC 19757-7(Character repertoire validation)のエディタに村田真が指名され, 11月の総会で承認された.


2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2004年度に進捗があったパートの動向を次に示す.9月に主要メンバがケンブリッジ(英)に集まってDSDLの議論と編集作業を行い,11月の総会では各パートに関する行動計画を確認すると共に, XMLおよびXML名前空間の1.1版が与える命名規則などの拡張を受け入れるための検討が指示された.

a) パート1(Overview)

受理したコメントに基づいてCDテキスト改訂版が配布され, 2005年2月を期限とする投票が行われた.日本は"このパートは規定ではないため, TRにする"ことを求めて条件付き反対投票を行っている.投票結果は賛成多数で承認された.

この概要(Overview)については, これまでに次の3回のCD投票が行われている.
- SC34 N275, 期限2002年3月
- SC34 N365, 期限2003年3月
- SC34 N567, 期限2005年2月

b) パート2(Regular-grammar-based validation -- RELAX NG)のAmd.1

RELAX NGの簡潔構文(Compact syntax)をAmd.1として追加するためのPDAMテキストが配布され, 2004年9月を期限とする投票が行われた.日本はコメント付き賛成として, OASIS規定のAnnex A(Formal description)をこのAmd.1に含めることを求めた.9月のWG1会議ではこの要求と大きな変更を望まないUKの要求とが対立し, FPDAMテキストはAnnex Aを含めずに作成され, 配布された(投票期限は2005年5月).

今後のこのAnnex Aの扱いは, OASIS規定の作成者のWG1への参加に強く依存することになるであろう.

c) パート3(Rule-based validation -- Schematron)

スキマトロンは, 文書部品間または複数文書間の一貫性制約はほとんど記述できないというこれまでのスキーマ言語の機能を補って, 一貫性制約だけを記述するスキーマ言語であり, XML文書の構造及び内容に関する制約記述機構を提供する.

2004年9月を期限とするCD投票に対して, 日本とUKだけがコメントを出し, それを反映したFCDテキストが作成され, 配布された(投票期限は2005年6月).

d) パート4(Namespace-based Validation Dispatching Language(NVDL))

日本からFast-track手続きで提案し承認されたISO/IEC TR 22250-2(RELAX Namespace)をDSDLの体系に整合させたNVDLは, 異なるマーク付け語彙を記述するスキーマを組合せるための機構を規定する.

2002年度末のCD投票(SC34 N363)によって承認され, 2003年12月の会議で改訂テキストをFCD投票にかける決定がなされたが, SC34の手続きミスにより, FCD投票ではなく2004年9月を期限とするCD投票(SC34 N525)が行われ, 賛成多数で承認された.11月の総会では, 改訂テキストをFCD投票にかけることを承認すると共に, このパートはfreely availableな日本提案の原案に基づくので,その最終文書をfreely availableにすることをJTC1に依頼することにした.

FCDテキストは既に配布され, 2005年5月を期限とする投票に入っている.

e) パート5(Datatypes)

9月のWG1会議にエディタ(J. Tennison)からWDテキスト(SC34 N546, N546a1)の提案があったが, まだCDテキストは配布されていない.

f) パート7(Character repertoire validation)

9月のWG1会議で, 文字レパートリを構築するための単純なパートとして制定し,他のパートから呼び出せる内容とすることが決まった.既にCDテキストが配布され, 2005年5月を期限とする投票が行われている.

g) パート8(Document Schema Renaming Language)

9月のWG1会議で, このパートの名前をDeclarative Document ManipulationからDocument Schema Renaming Languageに変更し, CDを作成することになった.しかし, XMLパーサの上に構築できることを保証すべきとする日本意見はまだ受け入れられてなく, CDテキストも作られていない.

h) その他のパート

9月のWG1会議では, パート6(Path-based integrity constraints)についてパート3との重複が議論され, パート10(Validation management)に関して, Ant, Cocoonなどとの比較検討が議論された. パート9(Datatype- and namespace-aware DTDs)については, 12月の総会でWDテキストの作成が指示された.

(2) 数学用及び科学用の公開実体集合(ISO/IEC TR 9573-13 第2版)

しばらく会議で議論されることのなかったISO/IEC TR 9573-13 第2版のPDTRテキストが, 2005年2月になって突然配布され, 投票が開始された(投票期限は2005年5月).

2.2 WG2(情報表示)

(1) DSSSLライブラリ(ISO/IEC TR 19758)のAmd.1〜3

DSSSLライブラリは, SGML(ISO 8879)又はXMLで記述された複雑な構造化文書に対して, DSSSLを用いてフォーマット指定を行う場合に用いるDSSSLライブラリを提供する.このライブラリを用いることによって, DSSSL及び組版に関する専門的な知識を必要とせずに, フォーマットのDSSSL指定を行うことを可能にする.日本からのFast-track手続きによるこのTRは, 2003年3月末に出版されたが, このライブラリの内容に対する追加要求が, Amd.1〜3として議論されている.

Amd.1は, 表組に関するスタイル指定ライブラリを追加し, 基本組体裁を拡張する.表組の規定内容は, 標準情報TR X 0010追補1に基づき, 基本組体裁の拡張は, 日本規格協会(JSA)の情報技術標準化研究センター(INSTAC)における電子出版技術調査研究委員会(EPCom)の2002年度の調査研究に基づく.2004年8月を期限とするDAM投票で承認され, 11月に最終テキストが提出された.2005年3月には校正刷りのチェックを完了している.

Amd.2は, 東南アジアの文書で用いられるスタイル要素をライブラリに追加する.これらのスタイル要素提案は, 国際情報化協力センター(CICC)のDocSIIプロジェクトの現地調査によってその利用者要求が明らかにされ, INSTACにおけるEPComおよびe-Book標準化調査研究委員会(e-Book)の調査研究によって記述されたライブラリに基づく.2004年8月を期限とするDAM投票で承認され, 11月に最終テキストが提出された.2005年3月には校正刷りのチェックを完了している.

Amd.3は, 南アジアおよび北アジアの文書で用いられるスタイル要素をライブラリに追加する.これらのスタイル要素提案も, CICCのDocSIIプロジェクトの現地調査によってその利用者要求が明らかにされ, INSTACのEPComおよびe-Bookの調査研究によって記述されたライブラリに基づく.

Amd.3のPDAMテキストは2004年7月を期限とする投票で承認され, それへのコメントを反映したDAMテキストを投票のためJTC1に送付することが11月の総会で決まった.その後, SC34セクレタリアトからの数回に及ぶJTC1への問合せに対してJTC1セクレタリアトは無応答を続け, 結局DAMテキストが配布されたのは, 2005年3月であった.

Amd.2およびAmd.3のテキスト作成に際しては, Pメンバでないアジア諸国の専門家のレビューが重要であるため, エディタはCICCのDocSIIプロジェクトに参加して現地を訪れ, コメントの収集とテキストへの反映を行った.

(2) DSSSL(文書スタイル意味指定言語, ISO/IEC 10179)のAmd.2

Amd.2は, 多言語文書スタイル及び複雑な文書スタイルをDSSSLで記述し易くするために, 既存のDSSSL規定の12.6.2〜12.6.30における流し込みオブジェクトクラスの規定内容に拡張を与える.拡張される主な機能は, ドロップキャップ, ベースラインシフト, 多様なノンブルフォーマットなどである.

2004年4月の会議で作成したFPDAMテキストは, 7月を期限とする投票で承認され, その際のコメントを反映したFDAMテキストが11月に作成された.その際には, DSSSLライブラリのプロジェクトからの要求も配慮された.FDAMテキストは既に配布され, 2005年5月を期限とする投票に入っている.

(3) フォント情報交換(ISO/IEC 9541-3, グリフ形状表現)のAmd.1

ISO/IEC 9541-3は, フォント情報交換に必要なフォント情報の構造記述において, Type1アウトラインフォントに基づくグリフ形状表現の交換フォーマットを規定する.Amd.1は, ビットマップフォントに基づくグリフ形状表現の交換フォーマット規定を追加する.これは, 主としてISO/IEC 10036登録機関からの要求に基づく.

2004年4月の会議で作成したPDAMテキストは, 7月を期限とする投票で承認され, その際のコメントを反映したFPDAMテキストが11月に作成された.FPDAMテキストは既に配布され, 2005年3月を期限とする投票で反対なしで承認された.

(4) 文書レンダリングシステムを指定する最小要件(Minimum requirements for specifying document rendering systems)のNP

スタイル指定を伴う構造化文書の交換に際して, レンダリング結果の版面の保存を確保するには, 送端と受端とにおけるレンダリングシステムにおけるスタイル機能の最小共通要件のネゴシエーションが必要である.このネゴシエーションに用いるスタイル機能仕様記述を規定するNP(新作業課題提案)が11月の総会で示された.

このNPは, アジアの10カ国の文書処理技術者が参加するDocSII Symposiumでの議論に基づく.DocSIIからのリエゾンがSC34/WG2でレビューされて, SC34からのNP提案となり, 2005年2月を期限とする投票によって, 5カ国の参加が表明され承認された.2005年5月を期限とするJTC1参加国のレビュー(JTC1 N7725)が行われている.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ, ISO/IEC 13250)マルチパート

トピックマップの規格を再構成してTM規定のマルチパート化を図る作業課題が2003年度から開始された.2003年度までの次の4パート構成の議論
- パート1 概要および基本概念
- パート2 データモデル
- パート3 XML構文
- パート4 正準構文
に対して, 2004年度からは
- パート5 参照モデル
の検討が追加された.2004年度に進捗があったパートの動向を次に示す.

a) パート2(Data Model)

トピックマップの抽象的な構造を示するために, データモデルに加えて, 併合規則および基本的な公開主題を規定する.2003年度に行われたCD投票のコメントを反映したFCDテキストが作成され, 2005年5月を期限とするFCD投票に入った.

b) パート3(XML Syntax)

トピックマップのXMLに基づく交換構文を示すために, XML交換構文と交換構文からデータモデルへの写像とを規定する. 2004年6月を期限とするCD投票のコメントを反映したFCDテキストが作成され, 2005年5月を期限とするFCD投票に入った.

c) パート4(Canonical Syntax)

トピックマップの正準化のアルゴリズムを示すために, 位置参照の正規化, 正準な分類順序およびデータモデルから正準XML情報セットへの変換を規定する. 2004年5月を期限とするCD投票のコメントを反映したFCDテキストが作成され, 2005年5月を期限とするFCD投票に入った.

d) パート5(Reference Model)

2004年8月のWG3会議で参照モデルの数学モデルが議論され, それを組込んだCDテキストを作成することが, 12月の総会で指示された.CDテキストは既に配布されて, 2005年5月を期限とする投票が行われている.

(2) TMQL(TM問合せ言語, ISO/IEC 18048)

2004年11月の総会では, WG3会議におけるエディタノートを受理して, エディタに対して, WG3での議論を組込んだCDテキストを作成し, それをCD投票にかけることを指示した.CDテキストは既に配布されて, 2005年5月を期限とする投票が行われている.

(3) TMCL(TM制約言語, ISO/IEC 19756)

2004年11月の総会では, エディタに対して, WG3での議論を組込んだCDテキストを作成し, それをCD投票にかけることを指示した.CDテキストは既に配布されて, 2005年5月を期限とする投票が行われている.


3. その他

SC34/WG2コンビナは, 文書レンダリングシステムを指定する最小要件のNP投票に際して, Pメンバに対して参加表明を依頼するため, CICCから交通費の半額の補助をいただき, 2005年1月に韓国を訪問した.韓国では韓国標準局(KSA)を訪問し, SC34/Korea国内委員会に参加してNPの詳細を説明し, このプロジェクトへの参加表明を求めた.詳細については, SC34専門委員会のウェブを参照されたい.

ISO/IEC TR 9573-11(規格文書の構造記述とスタイル指定)第2版は, 2004年4月に発行されたが, これを実際に国際規格の開発と発行に利用するための非公式な打合せが, ISO中央事務局で行われた.ISO/IEC TR 9573-11 第2版のエディタは, JSAから交通費の半額の補助をいただき, この打合せに参加した.詳細は, JSAのITSIG関連報告を参照れたい.

この種の非公式な打合せは, コンビナやエディタにはしはしば求められる.しかしそれらへの柔軟な対応は, 通常の海外出張予算の枠の範囲では行い難いため, 今後の国際標準化の積極推進に課せられた課題であろう.