7-7 ISO/IEC JTC1/SC34 文書の処理と記述の言語
Document Processing and Description Languages

小町 祐史
大阪工業大学

1. 担当範囲と組織構成

JTC1/SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.日本が幹事国を担当し,幹事国代表を木村敏子,議長を,Sam G. Oh(韓国)が務める.2009年度末には,37ヶ国のPメンバと19ヶ国のOメンバが参加して, 次の作業グループ(WG)が組織されている.

WG1(マーク付け言語) -- コンビナ: Alex Brown(英国).
SGML, XMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日本).
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: P. Durusau(US).
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

WG4(オフィス開放形XML:OOXML) -- コンビナ: 村田真(日本).
ISO/IEC 29500(OOXML)のメンテナンスを行い,OOXMLに関連するプロジェクトを傘下に置く.

WG5(文書の相互運用性) -- コンビナ: J. Lee(韓国).
異なるISO/IEC文書ファイルフォーマットで表された文書の相互運用性の原則と指針を開発する.

WG6(開放形文書フォーマット:ODF) -- コンビナ: F. Cave(英国).
ISO/IEC 26300(ODF)のメンテナンスに関係する活動を行う.ISO/IEC 26300のメンテナンスおよびISO/IEC 26300に関連する他の作業におけるOASIS ODF TCとの共同作業をも含む.

2. 主要プロジェクトの活動
2.1 WG1
2.1.1 文書スキーマ定義言語(DSDL, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLについて,2008年度以降に議論された主なパートの動向を次に示す.各パートの規定概要については,以前の報告を参照されたい.

(1) パート1(概要)

FCD投票の結果を受けて,ターゲットをISからType3のTRに変更し,テキストが提示されたらPDTR投票を開始する.これは,パート1の内容が規定でないことによる.

(2) パート2(正規文法に基づく妥当性検証−RELAX NG)のAmd.1

19757-2:2003に対して,19757-2:2003/Amd.1:2006とそれに対するCor.1との内容を含めた19757-2:2008(第2版)が2008年12月に発行された.同年にはRELAX NG利用者からのモジュール化機能の向上要求に応えて,19757-2:2008/Amd.1の開発に着手した.そのプロジェクトの進捗は遅れているが,W3Cとの協力関係が推進されている.

(3) パート3(規則に基づく妥当性検証 - Schematron)

19757-3の改訂のためにプロジェクトの細分割が行われ,CDテキストの作成が行われている.

(4) パート4(名前空間に基づく検証委譲言語(NVDL))のAmd.1

NVDLの名前空間名に基づくディスパッチ機能が不十分であるとのNVDL利用者の要求に応えて,Amd.1を開発することにした.

(5) パート5(拡張可能なデータ型)

データ型を定義するための言語であり,XML文書中の文字列をテストする.長大な正規表現を用いて不正確に記述しているデータ型が,この規定によって正確で簡素に記述できる.FCD投票の結果を反映して,FDISの処理のための改訂テキストの作成が行われている.

(6) パート7(文字レパートリ記述言語)

文字レパートリ(教育漢字,常用漢字など)を機械処理可能な形で記述するための言語である.FCDテキストへのコメント対処に基づいてFDISテキストが作成する際に,表題を"文字レパートリについての検証"から変更した.このFDISテキストは承認されて,国際規格として発行された.この作業は,対応するJISの原案作成と並行して行われ,国際規格の発行と共に,JIS原案が提出された.

(7) パート8(文書スキーマ再命名言語)

実体の宣言機構・改名機構を残すかどうかの問題点を適合性において明記し,機構そのものは残すことにしたFDISテキストが承認されて,国際規格として出版された.

(8) パート9(データ型および名前空間を認識するDTD)

FCD投票結果に基づいて軽微な修正を施したFDISテキストが承認されて,国際規格として出版された.

(9) パート11(スキーマ関連)

スキーマのロケーションに関するヒントを提供する処理命令を標準化する.文書とスキーマを結び付ける必要性が2009年3月に提案され,プロジェクト細分割によってこのプロジェクトが設立された.W3Cとの協力関係を結んで,CDテキストの作成が行われている.

2.1.2 規格文書交換のための構造記述およびスタイル指定(ISO/IEC TR 9573-11 第2版)のAmd.1

ITU-TのTSAG(Telecommunication Standardization Advisory Group)において参照され,ITU-T文書のXML交換様式との整合を考慮する検討が行われた.それにともなって,DAMテキストの提出が遅れている.ISO/ITSIG(Information Technology Strategies Implemenration Group)が開発するXML templateとの関連が深いため,協調を求めるリエゾンステートメントがITSIGに送付された.

2.2 WG2
2.2.1 フォント情報交換(ISO/IEC 9541)

SC29によって提案された14496-22(開放形フォントフォーマット)と9541との整合のために始められた,9541のパート3に対するAmd.とパート4とが完成し,それ以前から作業が続いていたパート1, 2に対するAmd.と共に発行された.

(1) パート1(体系)のAmd.4

9541-2/Am.2の中で使う幾つかの属性を9541-1の中で定義するために開発された9541-1/Amd.4のFDAMテキストが承認され,Amd.4が発行された.

(2) パート2(交換フォーマット)のAmd.2

フォント参照の拡張に関する利用者要求に応じて開発された9541-2/Amd.2のFDAMテキストが承認され,Amd.2が発行された.

(3) パート3(グリフ形状表現)のAmd.2

Adobe Type1 CharString互換のグリフ形状表現の拡張であるAdobe Type2 CharStringの内容を規定する9541-3/Amd.2のFDAMテキストが承認され,Amd.2として発行された.

(4) パート4(開放形フォントフォーマットとの整合)

9541の既存のパート1, 2, 3の修正では14496-22との整合に対応できない内容をまとめた9541-4のFDISテキストが承認され,国際規格として発行された.

2009年には,9541-4におけるvertTypoAscender要素,vertTypoDesender要素,およびVertical metric属性に関する記述を訂正するCor.1が承認され,発行された.

(5) ISO/IEC 9541の第2版

これまでの多くのAmd.とCor.の発行の結果,読みにくくなった9541に関して第2版を発行することをISO中央事務局から勧められ,パート1, 2, 3について第2版の開発を行うことを決めた.2009年にはエディタ会議を開催して作業の分担と方針を明らかにすると共に,WG2の会議の中でFCDテキストの進捗を確認している.

2.2.2 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

レンダリング結果において必要となる文書スタイルを保存したまま文書を交換し合うために,レンダリングシステムが共有しなければならない最小要件をネゴシェーションするための枠組みを規定する.2008年にはFDISテキストが承認されて,国際規格として出版された.

(1) パート2(文書レンダリングシステムのためのフォーマット指定)

24754の規定内容に従って,文書レンダリングシステムに対してどのようにフォーマット指定を行うかの指針を規定する必要があるとの要求を受けて,プロジェクトの細分割によって24754-2のプロジェクトを立ち上げ,2010年3月にはCDテキストを完成した.

2.2.3 UOML(非構造化マーク付け言語,DIS 14297)

OASISからのPAS手続きを用いてDIS 14297が提出され,2010年4月を期限とするDIS投票が行われた.日本は,内容が不明確であり,ODFに関してSC34で問題となったOASIS提出のexplanatory reportが全く改善されていないとして,反対投票を投じた.

2010年3月の総会では,OASISから推薦されたNingsheng Kiuをエディタとして指名し,必要に応じて,2010年9月に開催されるSC34会議に合わせて投票結果対処会議を開催することにした.

2.3 WG3
2.3.1 トピックマップ(TM, ISO/IEC 13250)

トピックマップの規格を再構成してTM規定のマルチパート化を図る作業課題が2003年度から行われているが,最近の主要パートの動向を次に示す.各パートの概要については,以前の報告を参照されたい.

(1) パート1(概要及び基本概念)

パート1の内容が規定でないため,13250-1をTR Type3に変更し,プロジェクトエディタに対してPDTRテキストの作成が指示された.

(2) パート3(トピックマップ,XML構文)の改訂

プロジェクト細分割によって,13250-3の改訂のためのプロジェクトが設立され,CDテキストの作成が行われている.

(3) パート4(正準構文,CXTM)

FDISテキストが承認されて,国際規格として出版された.

(4) パート5(参照モデル,TMRM)

FCDテキストが承認され,FDIS処理のために改訂テキストが用意されている.

(5) パート6(簡潔構文,CTM)

FCDテキストが承認され,FDIS処理のために改訂テキストが用意されている.

2.3.2 TMQL(TM問合せ言語, ISO/IEC 18048)

FCDテキストが承認され,2nd FCD処理のために改訂テキストが用意されている.TMQLについては,これまでに3回のCD投票と1回のFCD投票とが行われており,FCDからFDISへの早期進捗が望まれる.

2.3.3 TMCL(TM制約言語, ISO/IEC 19756)

FCD投票結果を受けて,2010年3月の総会でFDISテキストを作成することが指示された.

2.4 WG4

これまでに報告された多くの欠陥報告に応えるため,WG4はCor.とAmd.とを区別するための評価基準を作成して,OOXMLの各パートに対して,次に示すCor.とAmd.の開発を行っている.

2.4.1 OOXML(オフィス開放形XMLファイルフォーマット,ISO/IEC 29500)

(1) パート1, 2, 3, 4のCor.1

OOXMLの全パートに対する訂正案が承認されて,各パートのCor.1として出版された.

(2) パート1, 4のAmd.1

パート1, 4のFPDAMテキストが承認されて,FDAMテキストが作成された.

(3) パート4のAmd.2

2010年3月の総会で,パート4のAmd.2ためにプロジェクト細分割を行って,Amd.2の開発を行うことを決めた.

2.5 WG5

2.5.1 ODF-OOXML間の変換(ISO/IEC TR 29166)

2010年11月までにPDTRテキストを完成させることを目標として,ドラフト作業が継続されている.

2.6 WG6

ODFのメンテナンスのために設立されたWG6は,2010年3月にはじめての対面会議を行った.これまでのOASIS ODF TCには,SC34に対する消極的姿勢が目立ったが,このWG6会議にはOASIS ODF TCから3名の参加者があり,SC34からの要請に積極的に応じる姿勢が見られた.

2.6.1 ODF(開放形文書フォーマット)のAmd.1

ODF 1.0はISO/IEC 26300として制定されているが,広く使われている状態ではなく,アクセシビリティの機構も提供していない.ODF 1.1は広く使われていて,アクセシビリティの機構を提供しているが,まだ国際規格にはなっていなかった.そこで,ODFプロジェクトの細分割を行って,ODF 1.1を26300のAmd.1とするプロジェクトを設立した.