2005年度専門委員会関係活動報告
SC34専門委員会(文書の処理と記述の言語: Document Processing and Description Languages)

小町 祐史 (大阪工業大学)

1. 概要

1.1 担当範囲と組織構成

SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う.議長は, J. Mason(US).10ヶ国のPメンバと10ヶ国のOメンバが参加して, 次のWGが組織されている.

WG1(マーク付け言語) -- コンビナ: M. Bryan(UK)
SGMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: S. Pepper(ノルウェー)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

国内では, 19名の委員(オブザーバを含む)で構成されるSC34専門委員会が, 関連する国内意見のとりまとめと国際への対応とを行っている.2004年のはじめからはSC34/WG3小委員会の7名のメンバが, 主としてトピックマップに関する技術検討を行い,2005年7月には6名のメンバからなるSC34/WG2小委員会が設立され,フォント関連技術の検討が行われている.

1.2 国際会議と参加状況

SC34総会およびWG1, WG2, WG3会議(2005年05月22日〜26日,アムステルダム, オランダ):
8ヶ国から27名(日本から7名)が参加した.
SC34/WG2 ISO/IEC 24754編集会議(2005年10月13日〜14日,シンガポール):
5ヶ国から6名(日本から2名)が参加した.
SC34総会およびWG1, WG2, WG3会議(2005年11月12日〜16日,アトランタ, USA):
7ヶ国から22名(日本から4名)が参加した.

1.3 投票等

DIS投票 1件
(DIS 26300)
FDIS投票 2件
(FDIS 19757-3, FDIS 19757-4)
FDAM投票 2件
(FDAM1/9541-3, FDAM1/19757-2)
DAM投票 1件
(DAM3/TR 19758)
FCD投票 5件
(FCD 19757-3, FCD 13250-2, FCD 13250-3, FCD 13250-4, FCD 19757-1)
FPDAM投票 1件
(FPDAM1/19757-2)
CD投票 5件
(CD 19757-7, CD 13250-5, CD 18048, CD 19756, 2ndCD 19756)
PDTR投票 1件
(PDTR 9573-13)
NP投票 2件
(NP/Compact topic maps syntax, NP/Graphical topic maps notation)
規格出版 6件
(ISO/IEC 10179/Amd.2, ISO/IEC TR 19758/Amd.1, ISO/IEC TR 19758/Amd.2, ISO/IEC TR 19758/Amd.3, ISO/IEC 9541-3/Amd.1, ISO/IEC 19757/Amd.1)

1.4 国際委員会の主な変更点および変更理由

2005年度からは,タイがPメンバとして参加することになった.このタイの参加については,CICC(国際情報化協力センター)の積極的な働きかけがあった.

1.5 日本担当のエディタの変更

ISO/IEC 9541-2(Font Information Interchange - Interchange format)/Amd.2(Extension to font reference)のエディタに小熊 新一および小町 祐史が指名され,ISO/IEC 24754(Minimum requirements for specifying document rendering systems)のエディタに上村圭介が指名された.

ISO/IEC TR 9573-11(Structure descriptions and style specifications for standards document interchange)/Amd.1(Authoring structure and style specification)のエディタに小町 祐史および村田真が指名された.


2. 主なプロジェクトの進捗状況

2.1 WG1(マーク付け言語)

(1) DSDL(文書スキーマ定義言語, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLに関して, 2005年度に進捗があったパートの動向を次に示す. パート2についてはAmd.1が出版され,パート3とパート4はFDIS投票に達することができた.年度末にはパート5, 8, 9のCDテキストが配布されたが,それらの規定内容は国際規格としてまだ不十分である.

a) パート1(概要)

DSDLの翻訳JISであるJIS X 4177のパート構成上の必要性を受けて,これまでCD段階に留っていたパート1の編集作業が進められ,FCDテキストが作成されて2006年4月を期限とするFCD投票にかけられた.

b) パート2(正規文法に基づく妥当性検証−RELAX NG)のAmd.1

FPDAM投票結果のレビューに基づき, 簡潔構文(compact syntax)のための固有のメディア型の定義を組込んだ改訂テキストがFDAM投票で承認され,2006年1月に出版された.

SC34はこのテキストを無償公開(freely available)にすることをJTC1に求めると共に,今後のSC34の規格における文書化スキーマにISO/IEC 19757-2(RELAX NG)の簡潔構文を採用することを推奨し, JTC1参加国が, ISO 8879のDTD又はW3C XML Schemaに代わってこの簡潔構文を利用することを推奨している.

c) パート3(規則に基づく検証−Schematron)

スキマトロンは, 文書部品間または複数文書間の一貫性制約はほとんど記述できないというこれまでのスキーマ言語の機能を補って, 一貫性制約だけを記述するスキーマ言語であり, XML文書の構造及び内容に関する制約記述機構を提供する.

FCD投票のコメントを反映したFDISテキストが作成され,2006年4月を期限とするFDIS投票にかけられた.

この規格は台北のASCC(Academia Sinica Computing Centre)による無償公開の規定に基づくので, その最終テキストを無償公開にすることを, SC34はJTC1に求めている.

d) パート4(名前空間に基づく検証委譲言語−NVDL)

日本からFast-track手続きで提案し承認されたISO/IEC TR 22250-2(RELAX Namespace)をDSDLの体系に整合させたNVDLは, 異なるマーク付け語彙を記述するスキーマを組合せるための機構を規定する.

FCD投票のコメントを反映したFDISテキストが作成され,2006年4月を期限とするFDIS投票にかけられた.

この規格は, publicly availableな日本の規定に基づくので, その最終テキストを無償公開にすることを, SC34はJTC1に求めている.

e) パート5(データ型)

DTLL(Datatype Library Language)に基づくCDテキストが作成され,2006年5月を期限とするCD投票が行われている.

備考 DTLLについては,http://www.jenitennison.com/datatypes/DTLL.html を参照.

f) パート7(文字レパートリについての検証)

2005年5月を期限とするCD投票で承認されたが,CD投票に際してのコメント対処に示される変更を組込んだ改訂テキストの作成が遅れている.

g) パート8(文書スキーマ再命名言語)

2005年11月のWG1会議での勧告を受けて,CDテキストが作成され,2006年5月を期限とするCD投票が行われている.

h) パート9(データ型および名前空間を認識するDTD)

2005年11月のWG1会議での勧告を受けて,CDテキストが作成され,2006年5月を期限とするCD投票が行われている.

i) パート10(検証管理)

既存の原案をPDTRテキストとして公表し,W3CによるXML処理言語(XML PL)の開発のための要件文書としてW3Cに提出した.その活動が進むまで,パート10の作業を中断することにしている.

(2) 数学用及び科学用の公開実体集合(ISO/IEC TR 9573-13 第2版)

2005年5月の会期中にPDTR投票が締め切られ, 次の方針を決定した.Unicode Consortiumが提出したコメントを配慮して, リエゾンステートメントをUnicodeに提出し, 詳細なコメント対処を作成する.その後,それを組込んだ DTRテキストを配布すると共に,この規定の最終テキストを無償公開にすることを, JTC1に求める.

(3) 規格文書交換のための構造記述およびスタイル指定(ISO/IEC TR 9573-11 第2版)のAmd.1

ISO/IEC 9573-11 第2版が規定する規格文書交換のための構造記述(SGML, XML)およびスタイル指定(DSSSL, XSL, XSLT)がISO Directivesに従うため,必ずしもエディタにとって使い易いものでない.そこでISO/IEC 9573-11 第2版の部分集合に近い規定内容をもつエディタ用の構造記述およびスタイル指定がISO/ITSIG(Information Technology Strategies Implementation Group)によって要求された.この要求に応えて,Amd.1が企画され,そのプロジェクトが設立された.Amd.1としてのRELAX NGスキーマとXSLスタイルシートは,Sourceforge(http://sourceforge.net/projects/tr9573amd)に掲載されて,関係者に試用されている.

2.2 WG2(情報表示)

(1) DSSSLライブラリ(ISO/IEC TR 19758)のAmd.1〜3

DSSSLライブラリは, SGML(ISO 8879)又はXMLで記述された複雑な構造化文書に対して, DSSSLを用いてフォーマット指定を行う場合に用いるDSSSLライブラリを提供する.このライブラリを用いることによって, DSSSL及び組版に関する専門的な知識を必要とせずに, フォーマットのDSSSL指定を行うことを可能にする.

このライブラリの内容に対する追加要求が, Amd.1〜3として議論されてきたが,昨年度にDAM1, DAM2が投票で承認され,今年度になってDAM3が承認されて,いずれも次のとおり発行された.各Amd.の内容については,昨年度の報告を参照されたい.

番号 表題 発行日
Amd.1Extensions to basic composition styles and tables 2005-07-01
Amd.2Extensions to multilingual compositions (South-East Asian Compositions) 2005-07-01
Amd.3Extensions to multilingual compositions (North and South Asian Compositions) 2005-08-15

(2) DSSSL(文書スタイル意味指定言語, ISO/IEC 10179)のAmd.2

Amd.2は, 多言語文書スタイル及び複雑な文書スタイルをDSSSLで記述し易くするために, 既存のDSSSL規定の12.6.2〜12.6.30における流し込みオブジェクトクラスの規定内容に拡張を与える.拡張される主な機能は, ドロップキャップ, ベースラインシフト, 多様なノンブルフォーマットなどである.

昨年度に配布されたFDAMテキストは承認され, 2005年7月にAmd.2が発行された.前述のISO/IEC TR 19758/Amd.3と共に,このAmd.2の発行までの事務処理に際して,セクレタリアートの手違いがあり,多くの時間を費やすことになった.

(3) フォント情報交換(ISO/IEC 9541-3)

a) パート2(交換フォーマット)のAmd.2

5月のSC34総会において,ISO/IEC 9541-2におけるフォント参照の拡張に関する利用者要求を受理し, ISO/IEC 9541-2/Amd.2 (Extension to font reference)の開発のためのプロジェクトを設けた.

11月のWG2会議では,WD(作業ドラフト)を作成した.その際に,ISO/IEC 9541-2/Am.2の中で使う幾つかの属性がISO/IEC 9541-1の中で未定義であるため,それらをISO/IEC 9541-1のCor.において定義する必要があることを明らかにした.

b) パート3(グリフ形状表現)のAmd.1

ISO/IEC 9541-3は, フォント情報交換に必要なフォント情報の構造記述において, Type1アウトラインフォントに基づくグリフ形状表現の交換フォーマットを規定する.Amd.1は, ビットマップフォントに基づくグリフ形状表現の交換フォーマット規定を追加する.これは, 主としてISO/IEC 10036登録機関からの要求に基づく.

FDAMテキストは,2005年8月を期限とする投票で承認され,Amd.1として10月に発行された.

(4) 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

スタイル指定を伴う構造化文書の交換に際して, レンダリング結果の版面の保存を確保するには, 送端と受端でのレンダリングシステムにおけるスタイル機能の共通の最小要件のネゴシエーションが必要である.このネゴシエーションに用いるスタイル機能仕様記述を規定するNP(新作業課題提案)が,昨年度末にNP投票によって承認され,2005年5月を期限とするJTC1参加国のレビュー(JTC1 N7725)の結果,プロジェクトが成立した.

11月のWG2会議において,WDおよび利用者要求文書として作成し,それらの文書をレビューとコメントのためにSC34メンバに配布した.同時にWG2は,WDへのコメントに対する審議の後,CD投票のための新テキストを生成することを,エディタに対して指示している.

2.3 WG3(情報関連付け)

(1) TM(トピックマップ, ISO/IEC 13250)マルチパート

トピックマップの規格を再構成してTM規定のマルチパート化を図る作業課題が2003年度から行われているが,2005年度に進捗があったパートの動向を次に示す.

a) パート2(データモデル)

FCDテキストが2005年5月を期限とする投票で承認された後,何度もコメント対処の議論が行われ,2005年度末にようやくFDISテキストが完成した.

b) パート3(XML構文)

FCDテキストが2005年5月を期限とする投票で承認された後,何度もコメント対処の議論が行われたが,2005年度末にはまだFDISテキストはできていない.

c) パート4(正準XML構文)

FCDテキストが2005年5月を期限とする投票で承認された後,11月のWG3会議ではエディタが変更された.WG3は,これまでのコメントを反映した新たなFCDテキストを提出することを,エディタに指示している.

d) パート5(参照モデル)

CDテキストが2005年5月を期限とする投票で承認された後,何度もコメント対処の議論が行われ,2006年2月に新たなCDテキスト(SC34 N710)が配布された.投票期限は2006年5月である.

(2) TMQL(TM問合せ言語, ISO/IEC 18048)

CDテキストが2005年5月を期限とする投票で承認されが,WG3はエディタに対して,コメントを反映した新たなCDテキストの作成を指示している.

(3) TMCL(TM制約言語, ISO/IEC 19756)

CDテキストが2005年5月を期限とする投票で承認されが,WG3はエディタに対して,コメントを反映した新たなCDテキストの作成を指示し,2nd CD投票が2006年1月に行われた.この2nd CDテキストは承認されたが,コメント対処はまだ行われていない.

(4) NP(TM簡潔構文)

次の要求に応えるため,簡潔なトピックマップ構文のNPが提案された.
・トピックマップの手作業での作成の容易化
・読みやすいサンプルの提供
・TMQL,TMCLの基盤としての軽量な構文の提供

このNPは,2006年3月を期限とするNP投票で承認された.

(5) NP(TM図式記法)

トピックマップの構造はグラフモデルあるため,図式記法を使うとその構造をストレートに表現できる.既に図式記法を実装している複数のツールが存在し,広く利用されてその有効性も広く認識されているので,国際規格としての図式記法が望まれるに至った.

NPは,特に次の要求の充足を目指している.
・トピックマップの内容の視覚化
・分りやすいトピックマップオントロジの開発
・トピックマップ作成のための図式ユーザインタフェースの提供

このNPは,2006年3月を期限とするNP投票で承認された.