電子Museum横断検索, komachi

電子Museum横断検索へのアプローチ

— 多様な情報の共有化へのフレームワーク —


小町 祐史/画像学会VMA/SG
松下電送システム(株)

2002-10-26, 東京国立博物館資料館
アート・ドキュメンテーション研究会


1. はじめに

画像電子学会のVMA研究会注1"博物館・美術館文書の構造記述SG(DTD-SG)"は, 博物館, 美術館の公開情報の論理構造を定義する文書型定義DTDの開発を目標として, 2000年9月から活動を開始した。その発端は,"文化遺産に関するVMA応用"をテーマとする, 2000年1月に行った第4回VMA研究会にある。その後の検討に基づき, 現在では, 幾つもの電子Museumが提供する情報を横断検索する(Museum毎の差異にとらわれずに, シームレスな検索を実行すること)ためのフレームワークについて調査研究を継続し, そのプロトタイプの作成を推進している。本稿はその概要を報告する。

注1: VMA研究会の概要を付録A.1に示す。


2. これまでの活動概要

VMA研究会, 特にそのDTD-SGが行ってきた主な活動を次にまとめる。

2002年6月までの主要な活動は, 2002年度年次大会テクニカルセションでの講演予稿にまとめられているので, "7. 博物館情報の知的横断検索のためのフレームワーク"の予稿を, 付録A.2として添付する。

3. 作業中の活動

各委員が, 独自の判断で手軽に集めた"館蔵品"の画像とmetadataとから成るサンプルデータベース(DB)を作成する。それらのDBの情報構造に対して, 付録A.2の"3. 情報共有のためのフレームワーク"に示すレベルTでのマッピングを試みる。このマッピングは, Dublin Coreに基づき, DB毎のDCセマンティクス定義を行う。

その後, 各DBの横断検索の評価(適合率)を行う。まずはオフラインで横断検索評価から始める, 並行して評価環境の検討を行う。

レベルIIに相当する各DBの範囲での語彙変換方式の検討は, その後の作業とする。


4. むすび

画像電子学会では, このVMA研究会SGにおける活動をさらに拡大し, 電子Museumに関する研究会の設立を検討している。関係各位の御参加を期待する。


文献

1) ISAD(G): General International Standard Archival Description, http://www.ica.org/biblio/com/cds/isad_g_2e.pdf
2) Z39.50ポータルサイト, http://www.globalfinder.net
3) CIDOC, http://www.cidoc.icom.org/
4) Dublin Core, http://dublincore.org/
5) 山田, 他: 博物館情報の知的横断検索のためのフレームワーク, IIEEJ 2002年度年次大会テクニカルセション 7., 2002-06-21
6) 今門, 他: 博物館情報の知的横断検索の試み, IIEEJ 2002年度年次大会テクニカルセション 8., 2002-06-21


付録

A.1 画像電子学会(IIEEJ) VMA(Versatile Media Appliance)研究会概要

1. 設立の経緯

最近の技術動向に即応し, 学会活動の活性化を主眼として, メディア統合技術研究委員会を改組し, VMA(Visual Media Appliance)研究会を設立することが, 画像電子学会の理事会によって1997年9月に承認された。その後, 数回のコアメンバによる準備委員会を開催して, 具体的な活動計画を策定し, 1998年2月に第1回のVMA研究会を開催した。以降, Visual Media Applianceをさらに広げてVersatile Media Applianceとすると共に, 年2回の研究会開催等の活動を継続している。

2. スコープ

主として自然画像の撮像, 画像の合成・加工・処理, それらの応用, およびそれらの結果として生じるVisual Appliancesについて論じると共に, その拡張としてのVersatile Applianceをも対象とする。扱う主な技術分野を次に示す。

3. VMA研究会推進体制

3.1 VMA委員会

VMA研究会の企画と実行推進を行う。研究会は公募による研究発表課題設定だけでなく, VMA委員会に設けられた研究グループ(3.2)による研究発表課題設定をも行う。

委員長:
 1997〜1999/05; 安田 浩(東京大学)
 1999/06〜; 小町 祐史(松下電送)

3.2 研究グループ(SG)

(1) AVシステム品質評価SG(AVQ-SG)

ネットワークオーディオ品質, オーディオとビデオの同期, マルチメディアとしての総合品質などの観点からのAVシステム品質評価法を検討する。SGおよびVMA研究会での議論の成果は, 学会だけに留めず, IEC/TC100等の国際標準化組織に提案して, 有効活用を図る。

主査: 池田 宏明(千葉大学)

(2) 博物館・美術館文書の構造記述SG(DTD-SG)

博物館, 美術館の文書情報の電子化が推進されている。今後, それらの情報が広く公開される場合に必要になる博物館情報の構造記述等の共通ファシリティの開発を目標として, 博物館・美術館関連情報の記述方法, アクセス方法を調査研究する。

主査: 安達 文夫(国立歴史民俗博物館)

4. 委員会等の活動

4.1 VMA委員会

4.2 AVシステム品質評価SG(AVQ-SG)

4.3 博物館・美術館文書の構造記述SG(DTD-SG)


A.2 IIEEJ 2002年度年次大会テクニカルセション7

博物館情報の知的横断検索のためのフレームワーク

画像電子学会VMA 研究会 博 物館・美術館DTD-SG
山田 篤 (京都高度技術研究所), 他

1. はじめに

画像電子学会VMA研究会「博物館・美術館文書の構造記述SG(DTD-SG)」は, 博物館, 美術館の文書情報の電子 化が推進されている状況の下で, 今後それらの情報が広く 公開される場合に必要になる共通DTDの開発を目標とし て, 博物館, 美術館の文書情報の構造(体裁上の構造と意 味上の構造)を調査研究するために設置された。本稿では, 複数の館が公開する文書情報を横断検索するためのフレ ームワークに関する本研究グループの検討結果について 報告する。

2. 横断検索に向けた分析

近年, 博物館・美術館情報の電子化が進み, 一部の館で はインターネットを通じて館蔵品に関する情報の提供や 検索サービスを行っている。現状ではこれらのサービス はそれぞれの館が独自に行っているため, 利用者側から見 た場合,

のもつ情報と関連付けて見ることが難しい といった問題点がある。利用者にとっては, 各館の差異に とらわれることなく, シームレスに検索ができることが望 ましい。これを横断検索と呼ぶことにすると, これを可能 ならしむるためには, 現状のような各館の自己努力だけで は不十分であり, 全体を統合する何らかの仕組みが必要と なるが, ここで, その統合の方法が問題となる。
: ディジタルミュージアムといった場合には館蔵品そのもののデ ィジタル化という方向も見逃せないが, 本稿では館蔵品そのもの ではなく, これに関する情報の取り扱いに限定する。また, 館側 の立場に立った館蔵品の管理情報の取り扱いについても本稿の範 囲外とする(Cf.CIMI [3])。

もっとも単純には, すべての館の館蔵品に関する情報を 記述するための共通のフォーマットを定義し, 各館がそれ に従い情報を提供することができれば, それを集中管理す るか分散処理するかは純粋に技術的な問題であり, 横断検 索の基盤は形成されることになる。実際に文化財情報につ いては文化財情報システムフォーラム[1]において共通索引 という試みが行われている。また, 国際的には, 非常に大 掛かりになる可能性はあるが, CIDOC [2]と呼ばれる取り組 みがある。

ところで, 世の中に実際に存在する博物館は多種多様で ある。その扱っている対象や規模も様々であれば, それを 扱う態度も様々である。そもそも命名や分類という行為は 私が世界をどのように分節化して考えるかという認知を 伴う思惟の表明であり, アプリオリに客観的ではありえな い。そういう意味で, 館による違いは各館の独自性を表し ているとも考えられる。

たとえば, ある館では美術品を主な対象としているた め, 館蔵品のことを作品と呼んでいるのに対し, 別の館で は史料と呼んでいる。そもそも美術品と史料を同じく扱お うとするところに問題があるのであって, 特定の分野, た とえば美術品ならば美術品のみに限定していけばよいと いうアプローチもあろうが, たとえば古書を対象にして も, 実際には, その言語的な内容に興味を持つ者もいれば, 文字そのものや紙面への割り付け情報に興味をもつもの, 紙質などの材質, 綴じ方や体裁に興味を持つもの等様々で ある。このように, 同一の対象に対してもその興味専門に よって違った見方をすることが普通である。この場合, heterogeneousであることが重要なのであって, 所蔵者の 観点と他者の観点が常に一致するとは限らない。さらに, ある観点で認識した結果をどのように表現するかという レベルでも多様性は生ずる。たとえば, 年代を時代名で表 すのか, 世紀で表記するのか, それとも西暦を用いるのか といった点にも表現者の判断が含まれている。

これは館の多様性のみならず, 利用者層の多様性にもつ ながる問題である。ある検索の仕組みを作るときに, 一般 にはターゲッティングが重要であると考えられているが, では博物館において, 専門家向け, 一般向け, さらには大 人向け, 子供向けといったように, それぞれ情報をカスタ マイズしていかねばならないのだろうか。

このように考えてくると, これは「多様な情報をいかに 共有するか」という一般的な問題であることがわかる。 我々はインターネット上で現在実際に公開されている情 報を分析し, シンタクスレベルでの共通化は可能だが, セマンティクスレベルでは今後相当の努力が必要となる と考えている。

3. 情報共有のためのフレームワーク

様々な多様性に対応した横断検索を考えた場合に定型 的なフォーマットですべての情報を表現しようとする monolithic な構造では対応が困難である。このため, 我々 は共通のシンタクスを用いながら, 様々なレベルの多様 性を許すような枠組みとして, 以下の3階層からなるフレームワークを提案する。

レベルIでは情報を記述するための構造(テンプレート)の共有と相互変換を行う。レベルIIでは情報の記述内容 のボキャブラリの共有と相互変換を行う。そしてレベルIIIではナビゲーションのための外在化された関係情報(リンク)の共有と相互変換を行う。以下, 順に説明する。

3.1 構造の共有

このレベルでは, 館蔵品(オブジェクト)に関する情報 をどのように記述するかについて, 記述の構造レベルでの 共通化をはかる。いわゆるDTDレベルの共有である。た だし, これは各館毎(インハウス)の独自のDTDを否定 するものではない。すなわち, 標準的な唯一の構造を強制 するのではなく, 各館の保有する情報がマッピング可能な 構造を探ることになる。このマッピングはXSLT [4]等によ る構造変換により実現可能である。また, 2館毎に変換規 則を作成するのではなく, 共通構造を中心としたスター型 の構成をとることにより, 効率化をはかる。

このレベルでの共有を実現することで, たとえばデータ ベースのスキーマレベルで, A館のxというスロットはB館のyというスロットに対応するといった対応をとることができるようになる。

3.2 ボキャブラリの共有

構造レベルでの共有が実現したとしても, そこに書かれ ている値について, 同じ内容が異なる表現がなされていれ ば, 単純な文字列操作ではその同一性は判定できない。そ こで次のレベルとして, 記述するボキャブラリの共有及び 相互変換をはかる必要がある。これは知識表現の分野では, 一般にオントロジーの共有と統合の問題として認識され ているものである。ここでも全体で唯一のオントロジーを 用いるのではなく, 最低限互いに情報を交換するための相 互変換を実現するための仕組みを導入することが望まし い。オントロジーについては理論的な検討から, 表現方法 についてもフレームベースのDAML+OIL [5]等, 様々な研 究がなされており, ここではその必要性を指摘するにとど めたい。

なお, 日本語に固有の問題として表記とその読みの対応 という問題があるが, それもこのレベルに含める

: 固有名詞とその読み等は構造レベルに組み込んでもよいだろ うが, 子供による検索を考えると, どんな易しい単語でもひらが なでもひけることが必要である。

3.3 関係情報の共有

このレベルではオブジェクト間の関係情報を記述する。 これは形態としては他のオブジェクトへのリンクという 形をとる。たとえば自ら執筆した解説文からオブジェクト へのリンク等である。ここでオブジェクト自身に関する情 報と関係情報(リレーション)を区別している。

博物館がもつ情報のうち, 専門家・学芸員等が持つ知識 はこのレベルに属する。オブジェクトを特定の観点から分 類したり, このように見て欲しいといった情報は, 利用者 をナビゲートするためのシナリオ記述としてここで記述 する。これは必ずしも専門家のみが作成する必要はなく, 小学生向けの教材としてのナビゲーションや個人的な覚 書としての記述等, 多種多様なものが存在するだろう。技 術的には, リンクそのものについては行外リンクとして URIベースのXLink [6]を用いることができるが, シナリオ 記述については別途検討が必要となる。

4. おわりに

本稿では様々な多様性に対応するための博物館情報の 横断検索のためのフレームワークに関する検討結果につ いて述べた。

素材としてのレベルIができれば, キーワードによるグ ループ化, クラスタ化による総覧の作成は容易にできる。 そこから先はセマンティクスにかかわる問題である。 レベルIIIのナビゲーションを作成する際にも, まず検 索を行うところから始まるだろう。

最後にレベルIIIの情報は現在のインターネットと同じ く非常に多様なものになることが予想される。場合によっ ては専門家の間でも意見の相違が見られることがあるだ ろう。このとき, 複数の知識が矛盾なく結びつく(結合)ことは可能かという問題が起こる。両立可能な情報ばかりとは限らない場合に, 互いに矛盾するかもしれない, 分散 して存在する知識を前に, それらを単純に結合するのでは なく, アラインメントをとる, さらには必要に応じて変換, 変形して自らに必要な情報を適切に発見し利用するため の枠組みを考えることは, 人間同士のインタラクションや, 発見, 関係構築へとつながり, 非常に興味深い課題である。

そのためにも, まずレベルIから順にプロトタイプによ る実証を行うとともに, 表現されていない情報は検索でき ないという点で, 情報を表現することのメリットを訴えな がら, 本フレームワークの実現に向けた検討を進めていき たい。

参考文献

[1] 文化財情報システムフォーラム (http://www.tnm.go.jp/bnca/)
[2] CIDOC (http://www.cidoc.icom.org/)
[3] CIMI (http://www.cimi.org)
[4] XSLT (http://www.w3.org/TR/xslt)
[5] DAML+OIL (http://www.w3.org/TR/daml+oil-reference)
[6] XLink (http://www.w3.org/TR/xlink/)