電子文書における表

小町 祐史 (パナソニックコミュニケーションズ(株))


長期的展望をもつことなく, 目先に突きつけられた課題だけを追い続けてきたが, 次々と新たな"目先の課題"が現われ, JTC1の文書処理の議論(当初はSC18/WG8, その後のSC34における議論)に参加し続けて10年以上が経過してしまった。

文書の電子化は文書情報を紙などのサブストレートから分離し, SC18/WG8の文書モデルは文書情報を論理構造とスタイル指定とに分離した。このモデルは, W3C(World Wide Web Consortium)にも受け継がれて, HTMLに関しては, HTML3.2への改版に際して, 処理系がデフォルトのレンダリングを行える簡素な論理構造を志向し, オプションのスタイル指定はCSS(Cascading Style Sheets)に任せるという方向付けが明確になった。この方向付けは, XHTML1.0の開発に際してさらに顕著になっている。

しかしHTMLは, 科学文書およびその他の技術文書の交換のために比較的簡単な文書を記述することに主眼をおいてSGMLの複雑さの問題に対処した(XHTML1.0の第1章における表現)ため, 論理構造とスタイル指定との分離に曖昧さを残している。その一例が表である。HTMLの表は, 行を示す要素型trとセルを示す要素型tdとで構成される。デフォルトのレンダリングを可能にするには, どうしても要素に行とセルというスタイルに直結する2次元構造を与える必要があり, その結果HTMLは, 一般的な表の多次元構造を記述できない。この点で, HTMLはいわゆるワードプロセッサに似ている。

そのような中途半端なHTMLを多くの利用者は支持し, Webの大量普及はInternetの普及に寄与した。これは, "人の思考も論理構造とスタイルとを完全に分離されているわけではなく, 文書の作成に際しては, ある程度スタイル展開された情報として文書を構成している"ことにもよると考えるべきであろう。例えば表情報を作成するとき, 人は紙面や画面の2次元に展開された情報として表を思考し, その結果として多次元構造に抽象化している。

当初から言われていたことではあるが, 文書情報を論理構造とスタイル指定とに完全に分離するだけでないモデルが新たな課題になりつつある。スタイル指定言語を介してその処理系からXML/SGMLデータへフィードバックする機能について, 既にSC34で議論が始まっている。なかなかSC34から足を洗えそうにない。