2006年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (大阪工業大学)

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.議長は, J. Mason(米).18ヶ国のPメンバと11ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: M. Bryan(英)
SGML, XMLに代表されるマーク付け言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: S. Pepper(ノルウェー)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

国内では, 20名の委員(オブザーバ2名を含む)で構成されるSC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.その傘下に,6名のメンバからなるSC34/WG2小委員会と,7名のメンバで構成それるSC34/WG3小委員会とがあり, それぞれフォント関連技術とトピックマップ関連技術とに関する国際標準化の検討を行っている.

1.2 国際会議と参加状況

SC34総会およびWG1, WG2, WG3会議(2006年5月29日〜6月1日,ソウル, 韓):
8ヶ国から29名(日本から4名)が参加した.
SC34/WG3会議(2006年10月13日〜15日,ライプチヒ,ドイツ):
8ヶ国から18名(日本から3名)が参加した.
SC34/WG2会議(2006年12月3日〜5日,ボストン,米):
3ヶ国から4名(日本から2名)が参加した.
SC34総会およびWG1, WG2, WG3会議(2007年3月22日〜24日,オスロ, ノルウェー):
11ヶ国から37名(日本から6名)が参加した.

1.3 投票等

FDIS投票 2件
(FDIS 13250-2, FDIS 13250-3)
FCD投票 1件
(FCD 19757-8)
CD投票 8件
(CD 13250-5, CD 19757-5, CD 19757-7, CD 19757-8, CD 19757-9(SC34 N709, SC34 N801), CD 18048, CD 24754)
NP投票 1件
(NP/TMによるDublin Coreメタデータ表現)
規格出版 5件
(ISO/IEC 19757-3, ISO/IEC 19757-4, ISO/IEC 13250-2, ISO/IEC 13250-3, ISO/IEC 26300)

1.4 国際委員会の主な変更点および変更理由

2006年度には次のメンバ増加があった.これは,ODF, OOXML等のホットなトピックがSC34に加わり,その議論への参加希望国が増えたことによると考えられる.

Pメンバへの新規参加
ブラジル,インド,カザフスタン,スウェーデン,スイス
OメンバからPメンバへの変更
チェコ,デンマーク,ドイツ
Oメンバへの新規参加
チリ,香港,スペイン

2007年2月になってカナダからSC34セクレタリアートの辞意が発表され(JTC1 N8513),それに応えて3月には日本がセクレタリアートを引き受ける用意があることを公表して(JTC1 N8546),5月14日を期限とするデフォルト投票が行われている.反対がなければ,SC34セクレタリアートが日本に移る.

1.5 日本担当のエディタの変更

ISO/IEC 9541-1(Font Information Interchange - Architecture)/Amd.4(Extension to font resource archtecture)のエディタに,小熊 新一および小町 祐史が指名された.

日本からTopic Maps BenchmarkおよびVisual Topic MapsのNP提案を行うに先立ち,2月26日の技術委員会でNP提案の承認を得ると共に,2月19日の役員会でF. Andres(国立情報学研究所)のプロジェクトエディタ就任の承認を得た.しかしSC34におけるこれらのNP処理が遅れていて,NP投票は次年度になる予定である.


2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2006年度に進捗があったパートの動向を次に示す. パート3とパート4は2006年6月に出版された.パート5, 7, 8, 9についてはCD投票が行われ,パート8はFCDに達したが,それらの多くの規定内容にはまだ検討すべき課題が含まれている.

a) パート1(概要)

2006年4月を期限とするFCD投票で承認されたことを受けて,コメント対処(SC34 N744)に示す変更を組込んだ改訂キストを用意し,2nd FCD投票にかける.日本はFCDテキストに対して,引用規格の更新とURI(Uniform Resource Identifier)をIRI(Internationalized Resource Identifier)に変更することとを要求した.

b) パート2(正規文法に基づく妥当性検証−RELAX NG)のAmd.1の技術訂正(TC)

Amd.1に関するTC案(SC34 N736)を作成した後,さらに日本から提出された誤り報告に応えて,投票のためのTC案を用意する.

c) パート4(名前空間に基づく検証委譲言語(NVDL))の技術訂正(TC)

JIS化作業で明らかになった日本からの誤り報告に応えて,投票のためのTC案を用意する.

d) パート5(データ型)

DTLL(Datatype Library Language)に基づくCDテキストが2006年5月を期限とする投票で承認された後,2007年3月の会議で新たな技術課題が提案された.それを含めてFCDテキストを用意し,投票にかける.日本はCDテキストに対して,漢字のdigit stringを数値に変換する機能についてコメントした.

備考 DTLLについては,http://www.jenitennison.com/datatypes/DTLL.html を参照.

e) パート6(パスに基づく一貫性制約)

XMLのストリーミングに関するW3Cの標準化作業をDSDLのパート6として提案できるかどうかを検討している.それが可能であれば,標題を"ストリームに基づく一貫性制約"に変更する予定である.

f) パート7(文字レパートリについての検証)

2005年5月を期限とするCD投票で承認された後,コメント対処(SC34 N632)の変更を組込んだ2nd CDが2007年2月に終了した投票で承認された.そこで,コメント対処(SC34 N851)に示す変更を組込んでFCDテキストを用意し,SC2にレビューを求めた後,投票に入る.日本は2nd CDテキストに対して,grapheme clusterの削除を求めた.

g) パート8(文書スキーマ再命名言語)

パート8は文書スキーマ定義言語の一つとして,XML文書中のタグ名・属性名などを別のものに 読み替えるための変換表について規定する.例えば日本語を用いるXML語彙を英語を用いるXML語彙に読み替える変換表を用意すれば,日本語XML文書を英語スキーマに照らして検証できる.

2006年5月を期限とするCD投票で承認された後,FCDテキストが2007年2月の投票で承認された.コメント対処(SC34 N852)の変更を組込んだFDISテキストを用意して,投票にかける.日本はFCDテキストに対して,次のコメントを提出した.
- スコープが明確ではなく,機能の取捨選択が恣意的である.
- 処理モデルがないため,意味が不明確である.
- XML 1.0に適合するXMLプロセサを用いる限り,この規格の実体宣言が無視されるのでこの規格に適合する実装はできない.

h) パート9(データ型および名前空間を認識するDTD)

2006年5月を期限とするCD投票で承認されたことを受けて,コメント対処(SC34 N748)に示す変更を組込んだ2nd CDが2007年2月の投票で承認された.そこで,コメント対処(SC34 N853)の変更を組込んで,FCDテキストを用意し,投票にかける.日本は2nd CDに対して,今さらこのようなDTD拡張を標準化しても意味はないとの否定的立場を示した.

i) パート10(検証管理)

W3CのXML Processing Model(XProc)の勧告候補ができてから,XProcの規定を用いてPDTRテキストを用意する.エディタはXProc作業グループのメンバである.

(2) 数学用及び科学用の公開実体集合(ISO/IEC TR 9573-13 第2版)

PDTRテキストに対する改訂案の中で提案された実体参照の変更に関するコメントを,エディタ候補のK. Simonsenがレビューして,この作業課題を継続するかどうかを決める.

(3) 規格文書交換のための構造記述およびスタイル指定(ISO/IEC TR 9573-11 第2版)のAmd.1

このAmd.1は,ISO/IEC 9573-11 第2版の部分集合に近い規定内容をもつエディタ用の構造記述およびスタイル指定であって,ISO/ITSIG(Information Technology Strategies Implementation Group)の要求に応えてそのプロジェクトが開始された.

SC34の各WGからの要求を満たしたPDAMテキストが作成され,それはISO中央事務局の出版部門とISO/ITSIG/XML template group会議(2007年3月)とにレビューのため提出された.このPDAMテキストはWG1でのレビューの後,投票にかけられる.

(4) ODF(オフィス応用のための開放形文書フォーマット,ISO/IEC 26300)

2006年5月を期限とするISO/IEC DIS 26300 (ODF: Open Document Format for Office Applications)のPAS投票の結果,反対投票なしでDISが承認された.そこでJTC1セクレタリアートの助言に従って,以前に計画した投票結果対処の会議を取消して,OASISのODF TCがこれからコメント対処を行い,改訂テキストとコメント対処とをSC34セクレタリアートが各国に送付して,30日デフォルト投票が開始された.デフォルト投票での承認を受けて,ISO/IEC 26300は2006年12月に出版された.

その後,日本でのこの規格のJIS化作業に際して幾つもの問題点が明らかになり,ISO/IEC 26300のエディタであるP. DurusauがTC案を用意して,WG1からリエゾンステートメント(SC34 N847)をOASISに送付することになった.

2.2 WG2(情報表示)

(1) フォント情報交換(ISO/IEC 9541)

a) パート2(交換フォーマット)のAmd.2

昨年度にISO/IEC 9541-2におけるフォント参照の拡張に関する利用者要求を受理し, ISO/IEC 9541-2/Amd.2 (Extension to font reference)の開発のためのプロジェクトを設けた.その後,2006年12月のWG2会議でPDAMテキストを作成し,WG2メンバレビューを受けた後,2007年3月のWG2会議でSC34 N274をPDAM投票にかけることを決めた.

b) パート1(体系)のAmd.4

ISO/IEC 9541-2/Am.2の中で使う幾つかの属性がISO/IEC 9541-1の中で未定義であるため,それらをISO/IEC 9541-1で定義する必要があり,2006年5月の会議でAmd.4のプロジェクトを設けた.2006年12月のWG2会議でPDAMテキストを作成し,WG2メンバレビューを受けた後,2007年3月のWG2会議でSC34 N275をPDAM投票にかけることを決めた.SC34 N275は,次のfont referencing属性を定義している.
- Typeface Class
- Kind
- Serif Style

(2) 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

レンダリング結果において必要となる文書スタイルを保存したまま文書を交換し合うために,レンダリングシステムが共有しなければならない最小要件をネゴシェーションするための枠組みを規定するため,日本からの提案によりこのプロジェクトが作られた.

WDへのコメントを反映したCDテキストが作られ,2006年8月を期限とする投票で承認された.2006年12月のWG2会議では投票結果対処とそれを含めたFCDテキストを完成し,2007年5月を期限とする投票に入っている.実際にこの規格に従って値を記述する際の例示があるとさらに使いやすい規格になるとの判断から,"実際に値を記述する際の例示を附属書(参考)として付けることが望ましい"との日本コメントがFCDに対して提出されている.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ,ISO/IEC 13250)マルチパート

TMの規格を再構成してマルチパート化を図る作業課題が2003年度から行われているが,2006年度に進捗があったパートの動向を次に示す.

a) パート2(データモデル)

パート2は,TMの抽象的な構造と構文の解釈とを規定し,TMの併合規則,基本的な公開主題識別子をも定義する.それによって,TMの計算機内部での表現方法を統一し,構文,処理環境に依存することなくTMがもつ情報を維持・共有・交換することが可能になる.

2006年6月のFDIS投票には日本はコメントなしの賛成を行い,8月にISO/IEC 13250-2が出版された.

b) パート3(XML構文)

パート3は,XML形式によるTMの具体的な交換構文を定義し,XML構文とパート2のデータモデルとの対応も定義する.TMを広く普及しているXML形式でシリアライズし,システム間で交換することを可能にする.

2006年11月のFDIS投票には,日本はこれまでの要求がすべて満たされているとの判断からコメントなしの賛成を行い,2007年3月にISO/IEC 13250-3が出版された.

c) パート5(参照モデル)

2006年5月を期限とする2nd CD投票に対して,日本は,proxies, subjects等の属性を識別するのにpublished subjectを使うことなどをコメントした.2nd CDテキストは承認され,コメント対処(C34 N769)に従ってFCDテキストが作成される.

(2) TMQL(TM問合せ言語, ISO/IEC 18048)

2006年10月を期限とする3rd CD投票に対して,日本は,既存の規格の拡張としての位置付けが明確でないとのコメントを提出した.この3rd CDテキストは承認され,コメント対処(SC34 N811)に従ってFCDテキストが作成される.

TMQLについては,これまで次のようにCD投票が繰り返されており,FCDからFDISへの早期進捗が望まれる.
2001-04, NP/CD投票終了,プロジェクト成立.
2005-05, 2nd CD終了.
2006-10, 3rd CD終了.
2007-09, FCD(予定).
2008-03, FDIS(予定).

(3) TMによるDublin Coreメタデータ表現(ISO/IEC TR 29111)

図書館等で広く利用されているメタデータのボキャブラリの一つであるダブリンコアをTMで記述することによって,ダブリンコアメタデータの主題に基づく分類,体系化が容易になり,その有益性を向上させることができる.そこで,TMでの統一された記述方法が必要となり,TR(Type 3)の開発プロジェクトが提案された.

このNPは2006年8月を期限とするNP投票で承認され,TR 29111の開発が始まった.2007年9月を目標としてPDTRが作成される.