2007年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (大阪工業大学)

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.議長は, 2007年12月までJ. Mason(US),それ以降,Sam G. Oh(韓国).2007年度末には,39ヶ国のPメンバと16ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: 2007年12月までM. Bryan(UK),それ以降,村田真(日本).
SGML, XMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: 2007年12月までS. Pepper(ノルウェー),それ以降,P. Durusau(US).
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

国内では, 20名の委員(オブザーバ3名を含む)で構成されるSC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.その傘下に,7名のメンバからなるSC34/WG2小委員会と,7名のメンバで構成されるSC34/WG3小委員会とがあり, それぞれフォント関連技術とトピックマップ関連技術に関する国際標準化の検討を行っている.

1.2 国際会議と参加状況

SC34総会およびWG1, WG2, WG3会議(2007年12月08日〜11日,京都, 日本):
15ヶ国から50名(日本から14名)が参加した.
SC34/WG3会議(2007年10月13日〜14日,ライプチヒ,ドイツ):
4ヶ国から10名(日本から1名)が参加した.
DIS 29500/BRM会議(2008年2月25日〜29日,ジュネーブ,スイス):
31ヶ国から112名(日本から4名)が参加した.
SC34/WG2会議(2008年3月31日〜4月1日,オスロ,ノルウェー):
2ヶ国から4名(日本から3名)が参加した.

1.3 投票等

DIS投票 1件
(DIS 29500)
FCD投票 3件
(FCD 24754, FCD 19758-8, FCD 19758-9)
FPDAM投票 2件
(FPDAM2/9541-2, FPDAM4/9541-1)
CD投票 3件
(CD 19757-6, CD 9541-4, CD 13250-6)
PDAM投票 4件
(PDAM2/9541-2, PDAM4/9541-1, PDAM1/TR 9573-11, PDAM2/9541-3)
PDTR投票 1件
(PDTR 29111)
NP投票 1件
(NP: Guidelines for RDF/TM)
DCOR投票 2件
(DCOR 19757-2/Amd.1, DCOR 19757-4)

1.4 国際委員会の主な変更点および変更理由

2007年度には次に示すメンバ増加があった.これは,OOXML(DIS 29500)がSC34に割当てられ,その議論への参加希望国が増えたことによると考えられる.

Pメンバへの新規参加
ブルガリア,コロンビア,コートジボアール,キプロス,エジプト,フィンランド,ケニア,レバノン,マルタ,ニュージーランド,パキスタン,ホーランド,スリランカ,トリニダードトバゴ,ベネズエラ,南アフリカ,ルクセンブルグ,マレーシア
OメンバからPメンバへの変更
チリ,フランス,ルーマニア,トルコ(その後再びOメンバ)
Oメンバへの新規参加
ギリシャ,クロアチア,インドネシア,イスラエル,メキシコ,オーストリア,ベルギー

カナダからのセクレタリアートの辞意(2007年2月)に応えて日本がセクレタリアート引受けの提案を行い,それがJTC1で承認された.2007年12月のSC34総会では,新セクレタリアート代表の木村敏子が紹介され,作業の引継ぎが行われた.

セクレタリアートの交代と並行して,長年SC34議長を務めたJ. Masonから退任の意向が示され,さらに各WGのコンビナの任期が切れる時期と重なり,この総会では次のオフィサ承認の手続きが行われた.
 ・SC34議長 (Sam G. Oh,新任)
 ・WG1コンビナ (村田真,新任)
 ・WG2コンビナ (小町祐史,継続)
 ・WG3コンビナ (P. Durusau,新任)

1.5 日本担当のエディタの変更

ISO/IEC 9541-3(フォント情報交換 - グリフ形状表現)/Amd.2(開放形フォントフォーマット用の追加形状表現技術)のエディタ,およびISO/IEC 9541-4(フォント情報交換 - 開放形フォントフォーマットとの整合)のコエディタに,鈴木俊哉が指名された.ISO/IEC 19757-1(文書スキーマ定義 - 概要)のエディタが,M. Bryanの退任に伴い,村田真に交代した.

日本からTM(トピックマップ)ベンチマークおよびビジュアルTMのNP提案を行うに先立ち,2007年2月の技術委員会でNP提案の承認を得ると共に,同月の役員会でF. Andresのプロジェクトエディタ就任の承認を得た.しかしSC34におけるこれらのNP処理が遅れていて,NP投票は2007年度には行われていない.


2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2007年度に議論された主なパートの動向を次に示す.各パートの規定概要については,以前の報告を参照されたい.パート8とパート9はFCD投票を受け,パート6についてはCD投票が行われた.

a) パート1(概要)

2007年12月に,改訂テキストをFCD投票に進めることにした.

b) パート2(正規文法に基づく妥当性検証−RELAX NG)のAmd.1の技術訂正(Cor.1)

技術訂正(Cor.1)案の投票が行われた.1回目の投票では賛成投票数が不十分であり(その理由として,旧セクレタリアートのメールシステムの動作不調と新Pメンバが投票しないことへの懸念が指摘された.)承認に至らなかったが,再投票の結果承認された.

c) パート4(名前空間に基づく検証委譲言語(NVDL))の技術訂正(Cor.1)

技術訂正(Cor.1)案の投票が行われた.1回目の投票では賛成投票数が不十分であり承認に至らなかったが,再投票の結果承認された.

d) パート5(データ型)

2007年12月に,改訂テキストをFCD投票に進めることにした.

e) パート6(パスに基づく一貫性制約)

CD投票における日本コメントに基づいて大きく修正され,ストリーム実装可能なパス式を切出して,それとSchematronからの呼出し方式とを規定することにした.

f) パート7(文字レパートリについての検証)

文字レパートリの登録簿としてUnicode ConsortiumのCLDRとIANAのCharracter Set Registryを参照することにした.新Pメンバが投票しないことへの懸念からFCD投票を見合わせていたが,SC34の新体制への移行の後,この修正を施したFCDテキストを投票にかけることにした.

g) パート8(文書スキーマ再命名言語)

実体の宣言機構・改名機構を残すかどうかが最大の課題であり,日本はCD投票に引き続いてFCD投票においてもこれらを削除することを主張した.しかしこれらの機構の問題点を適合性において明記し,機構そのものは残すことにしたFDISテキストを投票にかけることにした.

h) パート9(データ型および名前空間を認識するDTD)

FCD投票結果に基づいて軽微な修正を施したFDISテキストを投票にかけることにした.

i) パート10(検証管理)

DSDLの各パートを呼出すための機構であるが,今後の進展が不明確である.W3CのXML Processing Model(XProc)がこの機構となることが期待されている.

(2) 数学用及び科学用の公開実体集合(ISO/IEC TR 9573-13 第2版)

PDTRテキストに対する改訂案の中で提案された実体参照の変更に関するコメントをレビューし,この作業課題を廃止することにした.

(3) 規格文書交換のための構造記述およびスタイル指定(ISO/IEC TR 9573-11 第2版)のAmd.1

このAmd.1は,ISO/IEC 9573-11 第2版の部分集合に近い規定内容をもつエディタ用の構造記述およびスタイル指定であって,ISO/ITSIG(Information Technology Strategies Implementation Group)の要求に応えてそのプロジェクトが開始された.SC34の各WGからの要求を満たしたPDAMテキストが承認され,PDAM投票コメントに基づいた修正を行ってDAM投票に進めることになった.

(4) ODF(オフィス応用のための開放形文書フォーマット,ISO/IEC 26300)

日本でのこの規格のJIS化作業に際して幾つもの問題点が明らかになり,ISO/IEC 26300のエディタであるP. Durusauが技術訂正を用意して,WG1からリエゾンステートメントをOASISに送付したが,それに対する回答は得られていない.

(5) OOXML(オフィス開放形XMLファイルフォーマット,ISO/IEC 29500)

Ecmaからfast-track手続きを用いて提出されたDIS 29500に対して,2007年9月を期限としてDIS投票が行われた.日本は次の理由で条件付反対を表明した.
 ・ほとんどのXML検証器で,規格の一部であるW3C XML Schemaスキーマが動作しない.
 ・IETF の承認なしにpack URI スキームを利用している.
 ・パッケージ中のパート名としてASCII以外の文字が使えない.
 ・利用できるスキーマ言語がW3C XML Schemaに限られている.

DIS投票の結果,Pメンバの賛成投票が53.2%であったため承認に至らず,膨大な投票コメントに対する対処を検討するため(各国のコメントに基づいてDIS 29500を改善するため)の投票対処会議(BRM)が2008年2月にジュネーブで開催された.

このBRMにおいて,日本から提出した主要コメントの中で,OOXMLとODFの協調要請についてはスコープ外として審議されなかったが,他の主要コメントについては満足すべき対処が行われた.他国からの主要コメントについても積極的な対処が検討され,アクセシビリティの改善,過去との互換性のための機構を切り出すフレームワーク,マルチパート化などに大きな改善がなされた.

BRMの対処結果を考慮して,2008年3月29日を期限とする再投票が行われ,Pメンバの賛成投票75%を得て,この規格原案は承認された.この再投票に際して,日本は賛成を投じている.

2.2 WG2(文書情報表現)

(1) フォント情報交換(ISO/IEC 9541)

SC29によって提案されたISO/IEC 14496-22(開放形フォントフォーマット)とISO/IEC 9541(フォント情報交換)との整合のために,既に作業中のパート1, 2へのAmd.に加えて,ISO/IEC 9541のパート3に対するAmd.のプロジェクトを新設し,パート4の規定内容を修正して標題も変更することにした.

a) パート2(交換フォーマット)のAmd.2

フォント参照の拡張に関する利用者要求に応じて開発されたISO/IEC 9541-2/Amd.2のPDAMテキストは,投票で承認された.2007年12月のWG2会議で,その投票コメントへの対処と新テキスト作成とが行われ,FPDAM投票にかけられた.

b) パート1(体系)のAmd.4

ISO/IEC 9541-2/Am.2の中で使う幾つかの属性をISO/IEC 9541-1の中で定義するために開発されたISO/IEC 9541-1/Amd.4のPDAMテキストは,投票で承認された.2007年12月のWG2会議で,その投票コメントへの対処と新テキスト作成とが行われ,FPDAM投票にかけられた.

c) パート3(グリフ形状表現)のAmd.2

ISO/IEC 14496-22はグリフ形状表現に関する規定を含まないが,TrueType形式のアウトライン表現またはAdobe Type2 CharStrings (Adobe Type1 CharStringsの拡張仕様)によるアウトライン表現を認めている.そこでISO/IEC 9541-3の追補として,Adobe Type1 CharString互換のグリフ形状表現の拡張であるAdobe Type2 CharStringの内容を扱う.FPDAMテキストが投票にかけられて承認され,次の段階に進んだ.

c) パート4(開放形フォントフォーマットとの整合)

このプロジェクトは,ISO/IEC 14496-22をDual-number規格としてISO/IEC 9541に含めるために設けられた.その後の検討により,ISO/IEC 9541の既存のパート1, 2, 3の修正では対応できない内容をまとめてこのパートで扱うこととし,標題を“開放形フォントフォーマット”から“開放形フォントフォーマットとの整合”に改め,CDテキストを作り直した.このCDテキストは投票にかけられて承認され,次の段階に進んだ.

(2) 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

レンダリング結果において必要となる文書スタイルを保存したまま文書を交換し合うために,レンダリングシステムが共有しなければならない最小要件をネゴシェーションするための枠組みを規定するため,日本からの提案によりこのプロジェクトが作られた.FCDテキストが承認され,2007年12月のWG2会議で,その投票コメントへの対処と新テキスト作成とが行われ,FDIS投票にかけられた.

(3) UOML(Unstructured Operation Markup Language)

2007年12月のSC34総会で中国の参加者から,OASISで検討を進めているUOMLをSC34に提案したいとの意向が表明され,ページ記述言語の抽象化という位置付けでWG2においてプレゼンテーションが行われた.中国NBとしての提案ができない状況であり,OASISで標準化を行った後,OASISからJTC1に提案してもらうことにした.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ, ISO/IEC 13250)マルチパート

TMの規格を再構成してマルチパート化を図る作業が2003年度から継続されているが,2007年度に進捗があったパート6の動向と,2007年12月のWG3会議で策定された作業計画とを示す.各パートの規定概要については,以前の報告を参照されたい.

a) パート1(概要及び基本概念)

WDの改訂が指示され,2008年1月にWD,7月にCD,12月にFCDを作成する計画が立てられた.

b) パート4(正準構文,CXTM)

FCDの改訂が指示され,2008年1月にFCD,5月にFDISを作成する計画が立てられた.

c) パート5(参照モデル,TMRM)

FCDの改訂が指示され,2008年2月にFCD,8月にFDISを作成する計画が立てられた.

d) パート6(簡潔構文,CTM)

CDテキストは2007年12月を期限とする投票で承認されたが,チェコ,ドイツ,日本,ノルウェー,UKから多くのコメントが提出された.12月のWG3会議でこれらのコメントがレビューされ,テキストの改訂が行われた.2008年2月にCD,8月にFCDを作成する計画が立てられたが,2007年度末にはまだ投票は開始されていない.

(2) TMによるDublin Coreメタデータ表現(ISO/IEC TR 29111)

図書館等で広く利用されているメタデータボキャブラリの一つであるダブリンコアをTMで記述することによって,ダブリンコアメタデータの主題に基づく分類,体系化が容易になり,その有益性を向上させることができる.そこで,TMでの統一された記述方法がを示すTR 29111の開発が始められた.

PDTRテキストは2007年11月を期限とする投票で承認され,日本とUKとからコメントが提出された.2008年2月にPDTR,8月にDTRを作成する計画が立てられたが,2007年度末にはまだ投票は開始されていない.

(3) NP(RDFとTopic Mapsとの相互運用性のための指針)

Topic MapsとRDF(Resource Description Framework,資源記述の枠組み)とは,いずれも情報資源とその中に含まれる主題を記述し,情報を見つけ易くする.しかしTopic MapsはSC34によって開発され,RDFはW3Cによって開発されていて,構造や記述するための要素を互いに異にする.この新作業課題提案は,この両者の違いを吸収し,データレベルでの相互運用性を高めるための指針としてのTRの開発を目指す.2008年3月を期限とする投票の結果,参加を表明したNBの数が4ヶ国であり,プロジェクトの成立に至らなかった.