標準報告書(TR)   TR X 0108:2005

日本語検索機能記述のための指針

解説



この解説は,標準報告書(TR)本体及び附属書に規定・記載した事柄,並びにこれらに関連した事柄を説明するもので,標準報告書(TR)の一部ではない。


1. 公表の趣旨及び経緯

1.1 公表の趣旨

情報処理システムの利用が一般化し,図書館での資料検索,インターネットでの情報検索 など,一般利用者も日常的に検索システムを用いるようになった。検索システムの利用者インタフェースも簡便化され,データベース検索専門家(サーチャ)などの手を借りずとも,索引語(キーワード)を入力して“検索”ボタンを押すといった簡易な操作で,データベース技術に関する知識が特にない一般利用者が検索を行うことが可能になった。しかし,こういった簡易な操作で,必ずしも目的のデータを見つけられるとは限らず,目的のデータがデータベース中に存在するのに見つけられないといった事態が頻繁に生じている。これは,利用者の知識不足及び熟練度不足という面もあるが,現状の情報検索システムが,索引語における自然言語としての日本語に対する機能不足又は配慮不足といった面も大きい。

漏れがなく,無駄がない情報検索を実現するための一方策として,検索システムの利用手引書などで仕様を明確に記述することが望まれる。しかし,実在の検索システムの多くは,日本語検索機能に関する説明が不十分であり,利用者がその検索システムを理解し効率的な検索をしようとしてもできない場合が多い。このような事態を改善するため,日本語検索機能として,どういった事項を記述すればよいかを検討し,列挙して,標準報告書(TR)としてまとめることとした。この標準報告書(TR)の指針に従って,利用手引書,ヘルプなどに仕 様記述を行って利用者に周知することで,利用者は,検索漏れがなく,無駄のない問い合 わせを実行することが可能になり,情報検索システムの利便性が向上する。

1.2 公表の経緯

財団法人日本規格協会 情報技術標準化研究センター(INSTAC)の将来型文書統合システム標準化調査研究委員会の作業グループ1(AIDOS-WG1)は,2003年度及び2004年度の活動の一つとして,インターネット時代の検索プロトコルに関する調査研究を行い,その成果の一部として,このTR原案を作成した。このTR原案は, 工業標準化法に基づいて,日本工業標準調査会 標準部会の情報技術専門委員会(2005年10月開催)で公表を承認された。


2. 審議中の検討事項

このTRをまとめるにあたっては,AIDOS-WG1において,情報検索プロトコル,データベース問合せ言語,データコード,日本語の符号化文字集合などの情報検索に関連する規格の調査,既存の主に図書館の検索システムの仕様に関する調査,ウェブ上の検索システムの概要調査,情報検索技術に関連する研究論文,書籍などの文献調査を行い,討論を行った。

AIDOS-WG1では,既存の規格では,自然言語である日本語を効率的に検索するといった観点からは不十分であると認識し,それを改善するための一方策として,日本語検索機能記述のための指針という形で示すこととした。日本語検索機能自体の標準化を図る規格作成も可能性としては検討したが,好ましい要求仕様はシステムにより異なるであろうし,既存データベースシステムとの互換性及び実装面からの困難さが生じる場合もあるため,機能自体の標準化ではなく機能記述のための指針の提示にとどめた。このTRの個々の箇条の内容については,さほど大きな議論になった点はない。

このTRの適用範囲には含まれないが,日本語に関連する検索技術として,文字列との完全な一致ではなく表記のゆれなどを人工知能的手法を使ってある程度システム側で自動判別し類似度を算出する“あいまい検索”,文字列の一致を中心とする検索ではなく内容の一致を中心とする検索(主題検索),書籍本文内容の自動抽出といった全文検索技術,文字だけではなく画像又は音声を含めた検索技術,目的データに近いであろう検索結果が先に出てくるように表示優先順位をつける技術など,様々な技術が開発されてきている。このような技術を標準化の面から考えていくことは今後の検討課題といえる。


3. 原案作成委員会の構成表

この標準報告書(TR)の原案を作成した財団法人日本規格協会 情報技術標準化研究センター(INSTAC)の将来型文書統合システム標準化調査研究委員会及びその作業グループ(WG1)の委員構成を,それぞれ解説表1及び解説表2に示す。

解説表1 将来型文書統合システム標準化調査研究委員会(AIDOS)
氏名所属
委員長小町 祐史パナソニックコミュニケーションズ株式会社
委員大野 邦夫株式会社ジャストシステム
宮澤 彰国立情報学研究所
安達 文夫国立歴史民俗博物館
飯島 正慶応義塾大学
黒田 信二郎株式会社紀伊国屋書店
内山 光一東芝ソリューション株式会社
河込 和宏株式会社東芝
菊田 昌弘株式会社シナジー・インキュベート
出葉 義治ソニー株式会社
長村 玄ネクストソリューション株式会社
山田 篤財団法人京都高度技術研究所
オブザーバ堀坂 和秀経済産業省 産業技術環境局
事務局内藤 昌幸財団法人日本規格協会
宮古 牧子財団法人日本規格協会

解説表2 将来型文書統合システム標準化調査研究委員会(AIDOS) 作業グループ1(AIDOS-WG1)
氏名所属
主査小町 祐史パナソニックコミュニケーションズ株式会社
委員飯島 正慶応義塾大学
内山 光一東芝ソリューション株式会社
大野 邦夫株式会社ジャストシステム
須栗 裕樹株式会社コミュニケーションテクノロジーズ
内藤 求株式会社シナジー・インキュベート
平山 亮金沢工業大学
宮澤 彰国立情報学研究所
山田 篤財団法人京都高度技術研究所
事務局内藤 昌幸財団法人日本規格協会
宮古 牧子財団法人日本規格協会