マルチメディアデータ構造と情報家電

Information Appliance on Multimedia Data Structure

小町 祐史 (Yushi KOMACHI)
VMA研究会委員長 (VMA Committee)


1. まえがき

Web技術によってインタネットは飛躍的な普及を遂げ,多くのインタネットユーザは, Web環境に蓄積された膨大なマルチメディア/ハイパメディア情報に容易にアクセスできるだけでなく, Webページへの情報掲載によって, 極めて手軽に不特定大量多数に対して情報提供することが容易になった。

動画像と音声を含むマルチメディアデータ構造の記述を核とするWeb技術は, さらにディジタル放送への適用をその手中に入れようとしている。これによってWebブラウザはディジタル放送の受信閲覧ソフトとなり, 家電装置となって一般家庭に入り込むことになる。このユーザ数の爆発的増加は関連ツールの低価格化を招き, その結果, 放送番組の編集と発信もが通常のコンピュータ上で可能となって, これまでWebページにHTML文書を掲載したのと同じ手軽さで個人が放送局を開設してデスクトップ放送を行うことも可能となろう。

このようなマルチメディア情報の家電への氾濫とそれをサポートする機器の高速化, 低価格化によって, これまでのコンピュータ技術と家電技術との境界がなくなり, その状態への中間段階で使われてきた"情報家電"ということばはいずれ使われなくなるかもしれない。ここでは敢えてその"情報家電"をキーワードとして, "2000年に飛躍する画像電子技術"を展望することにする。そのためのレファレンスとして, 著者を含むグループが作成し1999年10月にIECから発行されたマルチメディア技術のモデルを採用する。

2. マルチメディア技術における情報家電

マルチメディアはさまざま技術によって支えられた技術集合体であり, マルチメディアのシステムと機器をそのスコープとするIECのTC100は, その技術集合体の捕えどころを明確にするため, マルチメディア技術のモデル化[1]を行ってきた。そこではさまざまな座標軸によって表されるマルチメディア技術空間の中に, 動画像と音声を含むマルチメディアデータ構造が位置付けられ, アプリケーションの一形態として情報家電が明示されている。

2.1 マルチメディアデータ構造

IEC/TC100のマルチメディア技術モデル(IEC TR 61998)では, 図1に示すとおり, OriginatorとRecipientとの間の関係に着目する。例えば, 物理的/論理的な接続性においてはOriginatorとRecipientとはそれぞれ情報の送端と受端となり, 操作性においてはOriginatorとRecipientとは操作対象システムと操作者となる。OriginatorとRecipientとの間の関係は, Information Transfer MediaとTransfered Data Structureの観点からそれぞれほぼ独立に議論される。



図1 マルチメディアの機器/システムのGenericモデル

システム間のInformation Transfer Mediaは次のように分類される。

いずれのMediaに関してもシステム間のアプリケーションレベルでのTransfered Data Structureは, 次の観点からそれぞれの議論が行なわれなければならない。(図2参照)



図2 Intercommunication Mediaで交換されるアプリケーションレベルのTransfered Data Structure

IEC TR 61998は, このStructureに着目した議論(Structure Specific Model)のために, Dexter Model[7]にも言及している。このStrucuteを記述するための具体的な手法として, これまでSGML(Standard Generalized Markup Language)を拡張したHyTime[8]が知られているが, 最近ではXML[9]に基づくSMIL[2]がW3C(World Wide Web Consortium)によって開発され, さらに高度な放送番組内容に対応するため, SMIL Boston[3]への拡張が検討されている。

2.2 情報家電

情報家電はIEC/TC100の主要課題と考えられるため, Information Appliance Specific Modelを導入して検討すべき課題を明確化している。そこでは, homeおよびmobileの環境で利用される機器の構成要素の間のインタフェースが図3のとおり示され, 主として標準化のための調査研究の必要性と利用者要求とが強調されている。主な構成要素は次のとおりである。



図3 情報家電の機器構成に着目したモデル

3. インタネットによる放送

IEC TR 61998は, 適用範囲を広げたGenericモデルの議論をもっと具体的な議論に進めるため, アプリケーション固有のさまざまなマルチメディア技術に言及している。その一つがインタネットによる放送であり, 次の課題が取り上げられる。

表1 インタネットによる放送のための装置

Name of Component

Summary

Live

Ondemand

Video Recorder Equipment Equipment used to record images on location. Sends out NTSC format analogue image signals using video cameras, industrial video cameras, etc.

Necessary

Unnecessary

Video Player Equipment Equipment that reproduces images that have already been recorded and edited. Sends out NTSC format analogue image signals using VCRs and industrial VCRs.

Unnecessary

Necessary

Encoder Digitizes and digitally compresses analogue NTSC image signals. Often, uses a dedicated image compression board built into PCs. Two types of compression technology are used: MPEG, the standard image compression technology, and proprietary compression technology developed to achieve higher quality.

Necessary

Necessary

Transmission Server Sends out real-time image data that was digitized by the encoder and image data that is transmitted from the storage server to the Internet.

Necessary

Necessary

Storage Server Stores digitized image data and transmits them in chronological packages as requested by the receiving PC. One server may serve as both the transmitter server and the storage server.

Unnecessary

Necessary

Broadcast Server Processes the replay request to the storage server and the image data that is transmitted. Thus it eases the request processing placed on the storage server and balances the transmission speed to the Internet. This division of processes is often done on a separate server.

Used as necessary

Used as necessary

Receiver Client (Receiver Software) The image data sent from the storage server/broadcast server is replayed on the screen of a PC that uses the receiving software designed for each Internet broadcasting technology.

Necessary

Necessary



図4 インタネット放送のシステム構成

システム構成に示されるTransmission Serverで扱われる放送データの構造は, 2.1に示すTransfered Data Structureとしてcontents, structure, creationの課題をもつ。

4. SMILからSMIL Bostonへ

既存の放送をインタネットを介して配信する試みは既に始まっており, SMIL(同期化マルチメディア統合言語) 1.0[2]がW3Cによって開発された。このSMIL 1.0はWeb上でテレビ番組のような連続メディアを扱うことを容易にし, 自然な継続時間をもつメディアの放送形態のサポートを可能にする構造化データの記述を行う。

SMIL 1.0はXMLのDTD(文書型定義)であって, 次の機能を実現している。

しかしこれによって実現されるサービスは, 従来のテレビ放送に及ぶものではなく, しかもこれまでWeb環境で扱われてきた離散メディア(静止文書)との統合も必ずしも充分ではない。 このような問題点を解決するために, W3CではSMIL 1.0の拡張版(とりあえずSMIL Bostonと呼ばれる)の開発が行なわれている。既ににWDが公開され, テレビ放送との統合, アニメーション機能, 時間軸に沿ったプレゼンテーションのナビゲーションに対するサポートの向上, SMILマーク付けの他のXMLベースの言語とのインテグレーションなどが盛り込まれつつある。これによって, ディジタルテレビ放送にマルチメディアオブジェクトを統合することが極めて容易になる。ここでXMLは, SMIL 1.0の場合と同様にセマンティクスの表現手段として利用される。

1999年11月に公開されたSMIL Bostonが扱う主要項目を次に示す。

  1. About SMIL Boston
  2. Synchronized Multimedia Integration Language (SMIL) Modules
  3. The SMIL-Boston Animation Module
  4. The SMIL Content Control Module
  5. The SMIL Layout Module
  6. The SMIL Linking Module
  7. The SMIL Media Object Module
  8. The SMIL Metadata Module
  9. The SMIL Structure Module
  10. The SMIL Timing and Synchronization Module
  11. Integrating SMIL Timing into Other XML-Based Languages
  12. The SMIL Transition Effects Module
  13. The SMIL Document Object Model Module

ディジタル放送においては, 従来のテレビ放送のような連続メディアだけでなく, これまで新聞としてハードコピー配布されていたニュース情報のような静止文書も統合されることになり, XML等の記述言語で書かれた多様かつ大量なニュースコンテンツ[4]が日々一般家庭に届けられ, 視聴者または購読者は, 記述言語で書かれたコンテンツの構造を参照するブラウザを用いて各人各様の見方, 読み方でそれらのコンテンツをレビューすることになろう。

5. 放送データの利用技術

ディジタル放送によって統合送付されるマルチメディアデータは膨大であり, 利用者は必ずしもリアルタイムでそのすべてを利用するわけではない。図3に示すとおり, 放送受信システムに組み込まれた大容量の記憶にそれを貯え, 必要に応じてその内容を利用することになる。

そこでクローズアップされる課題が, データのOriginatorにとってそれがいつ誰に利用(又は再利用)され, 適切な料金が支払われることである。そこでTransfered Data Structureには, 広義のSecurityへの対応が組み込まれている必要があり, それはどのようなInformation Transfer Mediaに対しても適用できることが望まれる。

このSecured dataの取り組みは, 特にDVDなどの交換可能記憶メディア(Interchangeable Storage Media)を扱っているエキスパートによって, ユニバーサルディスクフォーマット[5]に対するSecurity機能の付加として以前から検討が進められており, 情報交換においてVolume/Fileを扱う論理構造(図5のVolume層とFile層)の上位構造に位置付ける階層での取り決め(図6参照)[6]が進行中である。



図5 交換可能記憶メディアによる情報交換のレアモデル



図6 ユニバーサルディスクフォーマットに対するSecurity機能の付加

6. VMA研究会

ここに示したようなマルチメディアデータ構造が拓く情報家電についての議論の場として, 画像電子学会はVMA研究会を用意している。そこで扱う課題は次のとおりである。

通常の物理的な研究会での議論の後でも, Webに掲載されたProceedingを見てさらに議論を継続できるようにするなど, 学会の研究会の形態についても検討を行っている。

文献