2011年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (大阪工業大学)

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.2007年12月より日本が幹事国となり,幹事国代表を木村敏子,議長を,Sam G. Oh(韓国)が務める.2011年度末には,34ヶ国のPメンバと21ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: Alex Brown(英国).
情報記述言語,主に標準一般化マーク付け言語(SGML),並びにSGMLのサブセット, API, 試験および登録に関連する補助的な規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日本).
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: P. Durusau(US).
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

WG4(オフィス開放形XML) -- コンビナ: 村田真(日本).
ISO/IEC 29500(OOXML)のメンテナンスを行い,OOXMLに関連するプロジェクトを傘下に置く.

WG5(文書の相互運用性) -- コンビナ: J. Lee(韓国).
異なるISO/IEC文書ファイルフォーマットで表された文書の相互運用性の原則と指針を開発する.

WG6(開放形文書フォーマット) -- コンビナ: F. Cave(英国).
ISO/IEC 26300 開放形文書フォーマットのメンテナンスに関係する活動を行う.ISO/IEC 26300のメンテナンスおよびISO/IEC 26300に関連する他の作業におけるOASIS ODF TCとの共同作業をも含む.

国内では, SC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.SC34専門委員会には,2011年度末には24名(エキスパート7名,オブザーバ1名を含む)がメンバ登録されている.その傘下に,6名のメンバからなるSC34/WG2小委員会と,8名のメンバで構成されるSC34/WG3小委員会とがあり, それぞれフォント関連技術とトピックマップ関連技術に関する国際標準化の検討をその担務としている.

1.2 国際会議と参加状況

表1に2011年度に開催された国際会議とそこへの参加状況を示す.なお,2011-04-01のSC34 総会とその直前のWG会議は,2010年度報告書に含めた.

表1 国際会議と参加状況
会議 開催日 参加者 開催場所
AHG4 2011-04-21 8ヶ国, 1リエゾン/16名,日本から5名 online
WG6 2011-04-27 5ヶ国, 0リエゾン/7名,日本から1名 online
WG4 2011-04-28 5ヶ国, 2リエゾン/9名,日本から1名 online
WG4 2011-05-26 5ヶ国, 2リエゾン/10名,日本から1名 online
AHG4 2011-06-02 6ヶ国, 1リエゾン/15名,日本から2名 online
WG6 2011-06-22 5ヶ国, 2リエゾン/8名,日本から1名 online
WG4 2011-06-20/22 5ヶ国, 2リエゾン/14名,日本から1名 Berlin/Germany
WG5 2011-06-23 4ヶ国, 2リエゾン/11名,日本から0名 Berlin/Germany
AHG4 2011-07-27 6ヶ国, 1リエゾン/10名,日本から2名 online
WG4 2011-07-28 5ヶ国, 2リエゾン/11名,日本から1名 online
WG4 2011-08-25 4ヶ国, 1リエゾン/10名,日本から1名 online
AHG4 2011-08-29 5ヶ国, 1リエゾン/11名,日本から3名 online
WG6 2011-09-14 3ヶ国, 2リエゾン/6名,日本から0名 online
WG4 2011-09-26/28 6ヶ国, 2リエゾン/23名,日本から2名 Busan/Korea
WG2 2011-09-28/29 3ヶ国, 0リエゾン/4名,日本から2名 Busan/Korea
WG1 2011-09-29 日本から2名 Busan/Korea
WG5 2011-09-29 5ヶ国, 0リエゾン/14名,日本から1名 Busan/Korea
SC34 2011-09-30 7ヶ国, 1リエゾン/24名,日本から3名 Busan/Korea
WG3 2011-10-07 日本から0名 online
WG4 2011-11-03 3ヶ国, 1リエゾン/7名,日本から1名 online
WG3 2011-11-04 日本から0名 online
WG3 2011-11-21 日本から0名 online
WG4 2011-11-29 4ヶ国, 1リエゾン/8名,日本から1名 online
WG4 2011-12-01 2ヶ国, 1リエゾン/名,日本から1名 online
WG4 2012-01-05 5ヶ国, 1リエゾン/10名,日本から1名 online
WG3 2012-01-05 日本から0名 online
WG6 2012-02-01 7ヶ国, 1リエゾン/10名,日本から1名 online
WG4 2012-02-06/08 5ヶ国, 2リエゾン/9名,日本から1名 Prague/Czech
WG4 2012-03-22 4ヶ国, 2リエゾン/8名,日本から1名 online

1.3 投票等

FDIS投票 5件
(FDIS 19756, FDIS 19757-5, FDIS 9541-1,-2,-3)
DTR投票 1件
(DTR 29166)
FDAM投票 1件
(26300/FDAmd.1)
DAM投票 2件
(29500-1/DAmd.1, 29500-4/DAmd.1)
FPDAM投票 1件
(26300/FPDAM1)
PDAM投票 2件
(29500-1/PDAM1, 29500-4/PDAM1)
NP投票 1件
(NP: Document Container File -- Part 1: Core)
DCOR投票 6件
(19757-8/DCor.1, 26300/DCor.2, 29500-1/DCor.1, 29500-2/DCor.1, 29500-3/DCor.1, 29500-4/DCor.1)
規格出版 13件
(29500-1,-2,-3,-4, 19756, TR 24754-2, 24754/Cor.1, 19757-5, 19757-11, 19757-8/Cor.1, TR 29166, 26300/Cor.2, 26300/Amd.1)

1.4 国際委員会の主な変更点および変更理由

EPUBの作業がSC34で標準化されることが望ましいかどうかを議論するため,2010年度に設立したアドホクグループ4(AHG4)を再設立し,それまでのコンビナおよびココンビナを再指名した.

4月にWG2およびWG3のそれまでコンビナを再指名し,9月にはWG1, WG4, WG5のそれまでのコンビナを再指名すると共に,SC34議長としてSam G. OhをJTC1に対して再推薦した.


2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2010年度に議論された主なパートの動向を次に示す.各パートの規定内容については,以前の報告を参照されたい.

a) パート5(拡張可能なデータ型)

データ型を定義するための言語であり,XML文書中の文字列をテストする.長大な正規表現を用いて不正確に記述しているデータ型が,この規定によって正確で簡素に記述できる.2010年度まで進捗が止まっていたが,FDIS投票で承認され,2011年10月にISO/IEC 19757-5が発行された.

b) パート11(スキーマ関連)

スキーマのロケーションに関するヒントを提供する処理命令を規定する.2010年度に行われたDIS投票で承認され,2011年11月にISO/IEC 19757-11が発行された.

c) パート8(文書スキーマ再命名言語)/Cor.1

主としてClause 5, 6, 7, 8, Annex A, Bにおける訂正を示すDCor.1の投票が承認されて,2011年12月にISO/IEC 19757-8/Cor.1が発行された.

d) その他

ISO/IEC 19757-2(正規文法に基づく妥当性検証−RELAX NG)/Amd.1をキャンセルして19757の新partとする計画は,2010年度以降の進捗はなく,ISO/IEC 19757-3(規則に基づく妥当性検証 - Schematron)の第2版に関するDISテキストはまだ配布されていない.

(2) NP(文書コンテナファイル)

ZIP仕様書(APPNOTE)を参照することによって,PKWareのZIPとの乖離を生じさせないようにしたマルチパート規格である文書コンテナファイルのパート1 コアのNPが承認された.それに伴って,EPUB OCF(Open Container Format)の分野におけるIDPF(International Digital Publishing Forum)の文書,Content Packaging Information Modelの分野におけるIMSの文書との整合性を高めるため,IDPFおよびIMS Global Learning Consortium(GLC)とのリエゾンの設立を図った.

2.2 WG2(文書情報表現)

(1) フォント情報交換(ISO/IEC 9541)の第2版

フォント情報交換の体系,交換フォーマット,およびグリフ形状表現を規定するISO/IEC 9541-1, -2,および-3の第2版のテキストを作成した.このテキストは第1版と,対応するAmd.およびCor.との編集上の統合であるので,CD投票とDIS投票を行なわず,2012年3月を期限とするFDIS投票によって承認された.出版のための最終テキストの作成が行われている.

(2) 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

レンダリング結果において必要となる文書スタイルを保存したまま文書を交換し合う際に,レンダリングシステムが共有しなければならない最小要件をネゴシェーションするための枠組みを規定する.そのパート2(文書レンダリングシステムのためのフォーマット指定)は,最小要件の規定内容に従って,文書レンダリングシステムに対してどのようにフォーマット指定を行うかの指針を与える.

2010年度に行われたDTR投票で承認され,2011年10月にISO/IEC TR 24754-2が発行された.TR 24754-2の出版に先立ち,ISO/IEC 24754の規格番号と標題をISO/IEC 24754-1,Minimum requirements for specifying document rendering systems - Part 1: Feature specifications for document rendering systems とするISO/IEC 24754/Cor.1を2011年8月に発行した.

(3) UOML(非構造化マーク付け言語)

2011年9月のWG2会議に参加した本件に関するOASISのエキスパートから,UOML-Xの開発状況の報告を受けた.そのdraftは未完成であり,実装による動作確認を含めて,完成までにさらに1.5年以上かかる予定であるとのことであった.したがってISOにどのように提出するかを議論する段階でないことを確認した.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ, ISO/IEC 13250)マルチパート

TMは情報オブジェクト集合の複数の並行的なビューを可能とする.TMの規格を再構成してマルチパート化を図る作業が2003年度から継続されているが,2010年度にISO/IEC 13250-6(簡潔構文)が発行された後の進捗はない.ISO/IEC TR 13250-1(概要及び基本概念)の進捗が特に遅れている.

(2) TMCL(TM制約言語, ISO/IEC 19756)

TMCLは,TMに対する制約を記述するスキーマ言語を規定する.2010年3月のSC34総会でFDISテキストの作成指示を受けたテキストが配布されて,2011年5月を期限とするFDIS投票で承認された.ISO/IEC 19756は,2011年6月に発行された.

2.4 WG4(オフィス開放形XML)

(1) OOXML(オフィス開放形XMLファイルフォーマット,ISO/IEC 29500)

これまでに報告された多くのDR(デフェクト報告)に応えるため,WG4はCor.とAmd.とで対応してきたが,それらに対して2010年度にCor.1とAmd.1とを本文に組込んだテキスト(Consolidated Text)を発行することを決め,2011年4月には29500-1および-4のAmd.2をAmd.1に名称変更して,それらを次のように推進した.

a) ISO/IEC 29500(OOXML)の新テキスト

Cor.1とAmd.1とを本文に組込んだテキストを,ISO/IEC 29500:2011として投票なしに発行することを2010年度に決め,2011年8月にISO/IEC 29500-1, -2, -3, -4を発行した.

b) パート1, 4のAmd.1

パート1, 4に関して2010年度に名称変更されたAmd.1について,PDAM投票が行われ,さらに2011年12月を期限とするDAM投票にまで進んだ.いずれも,スプレッドシートのセル値に用いるISO 8601の日付様式の問題への対処である.

b) パート1,2,3,4のCor.1

これまでに提出されたDRへの対応を進め,パート1, 2, 3, 4に関するDCor.1を作成して,1012年2月を期限とする投票を受けた.

(2) OOXMLファイルフォーマットの拡張(ISO/IEC 30114)

テキストがプロジェクトエディタによって提出されたら,CD投票を行うことを1011年9月のSC34総会で決定したが,まだ投票は行われていない.パート構成とその標題は,国際的には提示されていないが,ISO/IEC TR 30114-1(ガイドライン),ISO/IEC 30114-2(レパートリチェック)となる予定である.

2.5 WG5(文書の相互運用性)

(1) ODF-OOXML間の変換(ISO/IEC TR 29166)

DTR 29166に対する投票が2011年9月を期限として行われ,承認された.投票コメントへの対処を行って,2011年12月にISO/IEC TR 29166が発行された.

(2) "文書素片の識別と記述の参照モデル"に関する調査期間(study Period)

"文書素片の識別と記述の参照モデル"に関する調査期間は,2011年の4月および9月のSC34総会で延長され,2012年のはじめまでに調査結果の報告を行うことが求められている.

2.6 WG6(開放形文書フォーマット)

(1) ODF(開放形文書フォーマット,ISO/IEC 26300)のDCor.2

ISO/IEC 26300:2006に対して主としてClause 6, 7, 8, 9, 15における訂正を示すDCor.2が,2011年4月を期限とする投票で承認され,Cor.2が2011年12月に発行された.

(2) ODF(開放形文書フォーマット,ISO/IEC 26300)のAmd.1

ISO/IEC 26300:2006はOASISのODF 1.0であるが,既にODF 1.1が広く利用されている.このAmd.1はODF 1.1への対応を行うための修正である.

ISO/IEC 26300:2006に対するFPDAM.1テキストが2011年6月を期限とする投票で承認され,そこでのコメントを反映したFDAm.1テキストが2012年1月を期限とする投票で承認された.日本は,FPDAM.1の投票に際して,Amd.の標題にODF v1.1を明記することを要求した.ISO/IEC 26300/Amd.1は,2012年3月に発行された.

2.7 AHG4(EPUBの国際標準化方法を検討するアドホックグループ)

2011年9月のSC34総会で,AHG4の再設立を決定したが,その際のAHG4の委任条項は次のとおりである.