様々な多様性に対応した横断検索を考えた場合に定型 的なフォーマットですべての情報を表現しようとする monolithic な構造では対応が困難である。このため, 我々 は共通のシンタクスを用いながら, 様々なレベルの多様 性を許すような枠組みとして, 以下の3階層からなるフレームワークを提案する。
レベルIでは情報を記述するための構造(テンプレート)の共有と相互変換を行う。
レベルIIでは情報の記述内容のボキャブラリの共有と相互変換を行う。そして
レベルIIIではナビゲーションのための外在化された関係情報(リンク)の共有と相互変換を行う。
以下, 順に説明する。
このレベルでは, 館蔵品(オブジェクト)に関する情報 をどのように記述するかについて, 記述の構造レベルでの 共通化をはかる。いわゆるDTDレベルの共有である。た だし, これは各館毎(インハウス)の独自のDTDを否定 するものではない。すなわち, 標準的な唯一の構造を強制 するのではなく, 各館の保有する情報がマッピング可能な 構造を探ることになる。このマッピングはXSLT [4]等によ る構造変換により実現可能である。また, 2館毎に変換規 則を作成するのではなく, 共通構造を中心としたスター型 の構成をとることにより, 効率化をはかる。
このレベルでの共有を実現することで, たとえばデータ ベースのスキーマレベルで, A館のxというスロットはB館のyというスロットに対応するといった対応をとることができるようになる。
構造レベルでの共有が実現したとしても, そこに書かれ ている値について, 同じ内容を異なる表現がなされていれ ば, 単純な文字列操作ではその同一性は判定できない。そ こで次のレベルとして, 記述するボキャブラリの共有及び 相互変換をはかる必要がある。
これは知識表現の分野では, 一般にオントロジーの共有と統合の問題として認識され ているものである。ここでも全体で唯一のオントロジーを 用いるのではなく, 最低限互いに情報を交換するための相 互変換を実現するための仕組みを導入することが望まし い。オントロジーについては理論的な検討から, 表現方法 についてもフレームベースのDAML+OIL [5]等, 様々な研 究がなされており, ここではその必要性を指摘するにとど めたい。
なお, 日本語に固有の問題として表記とその読みの対応 という問題があるが, それもこのレベルに含める‡。
‡: 固有名詞とその読み等は構造レベルに組み込んでもよいだろ うが, 子供による検索を考えると, どんな易しい単語でもひらが なでもひけることが必要である。
このレベルではオブジェクト間の関係情報を記述する。 これは形態としては他のオブジェクトへのリンクという 形をとる。たとえば自ら執筆した解説文からオブジェクト へのリンク等である。ここでオブジェクト自身に関する情 報と関係情報(リレーション)を区別している。
博物館がもつ情報のうち, 専門家・学芸員等が持つ知識 はこのレベルに属する。オブジェクトを特定の観点から分 類したり, このように見て欲しいといった情報は, 利用者 をナビゲートするためのシナリオ記述としてここで記述 する。これは必ずしも専門家のみが作成する必要はなく, 小学生向けの教材としてのナビゲーションや個人的な覚 書としての記述等, 多種多様なものが存在するだろう。技 術的には, リンクそのものについては行外リンクとして URIベースのXLink [6]を用いることができるが, シナリオ 記述については別途検討が必要となる。