【情報処理学会レポート】一般セッションレポート(1) NHKの自動番組制作システム「TV4U」

      [2003/03/28]

    今回の全国大会では、昨年の第64回大会に比較して、大幅に「特別トラック」枠が拡大され、内容も充実したものになっているが、学会の"本流"とも言うべきものはやはり「一般セッション」だろう。ここでは、2日目(26日)の一般セッションに参加し、聴講したもののなかから、いくつか紹介してみたい。

    ○MPEG-7による自動番組制作システム

    まず、午後のセッション「画像検索、マルチメディアデータベース」のなかから、日本放送協会(NHK) 放送技術研究所の浜口斉周氏らのグループによる「MPEG-7メタデータを用いた自動番組制作システムの検討」を紹介したい。

    TV4Uの概要
    氏のグループでは、ユーザーの嗜好に応じて、映像やテキストなどの素材を収集し、自動的に番組を制作するシステム「TV4U(TV for you)」の開発を行っている。ユーザーが家庭から利用することを想定したクライアント・サーバー型のシステムで、このシステムを利用すれば、ユーザーは見たい内容をおおまかに指定するだけで、好みの演出で生成された番組を楽しむことができるようになるという。現状のテレビが大勢の視聴者に同一のコンテンツを提供しているのに対し、このシステムは個々のユーザーごとにパーソナライズされたコンテンツを提供するのが特徴で、ビデオ・オン・デマンドをさらに進化させたものと言っていいだろう。

    TV4Uによる番組制作の手順は、大きく分けて(1)ユーザープロファイルの設定、(2)素材の検索・収集、(3)CGキャラクター・字幕スーパーなどを合成し、番組を構成する--の3段階となる。

    自動制作の流れ
    まず、(1)のユーザープロファイルの設定では、ユーザーはどういった演出で、どういう構成の番組を見たいかを指定する。例えば、演出は「ニュースショー風」、構成を「NHK最新ニュース→映画のランキング」などと指定することが可能だ。

    次に、(2)の素材(動画・静止画・音声・テキストなど)の検索システムだが、ここではMPEG-7の検索サーバーとデータベースを利用する。MPEG-7ではコンテンツの特徴を記載することができるが、同システムにおいては、素材の「メディアタイプ」「ファイルフォーマット」「URL」「タイトル」「あらすじ」「制作者」「制作年月日」など15項目を記述。TV4Uクライアントから検索クエリーを受信したときには、データベースから条件に合致する素材を検索、結果をMPEG-7メタデータとしてクライアントへ返信する。

    さらに(3)では、(2)で受信したメタデータをもとに、TV4Uクライアント内の自動番組制作エンジンが「TVML」と呼ばれるスクリプトを出力する。このTVMLにはCGキャラクターが話す内容や字幕スーパー、動画再生の指示などを記載することができ、そのTVMLに従い、TVMLプレイヤーが番組を再生する。

    自動生成されたTVMLスクリプト
    そのTVMLからはこんな番組が

    会場では、ベータバージョンによるデモ映像が流されていたが、膨大な量のコンテンツを誇るNHKだけに、実際に運用されるようになれば検索システムとしても便利そうだ。今後は、本格的な実験システムの構築をすすめ、より知的な自動番組制作を目指す、としている。

    ○より快適なローマ字入力システム

    順序が前後するが、次に午前中の「ヒューマンインタフェース」セッションから、尚絅女学院短大の木村清氏による「Dvorak配列を用いたローマ字入力の改善について」を紹介する。

    PCで日本語入力を行う場合、カナ入力を使うユーザーもいるだろうが、多くのユーザーはローマ字入力を使っているだろう。また、PC用キーボードは慣用的にQWERTY配列を採用したものがほとんどであるので、多くのユーザーはQWERTY配列・ローマ字入力の組み合わせで日本語を入力しているわけだが、氏はこの日本語入力において、より効率的な入力を実現する方法を研究している。

    氏によると、「QWERTY配列はもともと、タイプライター時代の機械的な制約で考案されたもので、かならずしも打ちやすい配列ではない」と指摘する。しかし、QWERTY配列は多くのユーザーが使い、すでにデファクト・スタンダードとなっているため、「別の方式に移行することのリスクが大きい」(同氏)ことも事実。そこで、氏はQWERTY配列のまま、ローマ字入力の互換性を維持しつつ拡張をほどこした「AZIK」という入力方式を考案したが、今回、新たに「Dvorak配列」と呼ばれる配列のキーボードを使い、このローマ字拡張入力を適用した「ACT」方式を提案した。

    Dvorak配列
    Dvorak配列というのは、左手のホームポジションに母音を集中させた配列になっており、ローマ字入力のような子音と母音の組み合わせにおいては、左手・右手の指を交互に打鍵することが多く、打ちやすくなっているという。氏はこのDvorak配列において、左手下段の[K]の代わりに右手上段の[C]を使う、などの配列的な改善のほか、促音を[L]で入力したり、ai/uu/ei/ouなど頻出する二重母音を1ストロークで入力するなど、キーストロークを短くする拡張を行った。

    さらに、評価として、メール・Webなどから得た約32万文字のひらがなデータを用い、QWERTY配列/Dvorak配列とその拡張であるAZIK/ACTの計4通りでシミュレーションを行った。その結果、今回提案したACTではキーストロークがほかのものに比べ約22%減少したほか、指別の使用頻度でも、左右で46:54と、かなり均一に近づいた(Dvorak配列・標準入力では61:39)。

    ただ、効率が良くなっても覚えるのが難しくては結局利用されない。この点について氏は、この方式は拡張入力方式であるので、最初は基本的なものから、徐々に覚えていくことができると利点を述べ、個人の打鍵の好み、習得レベルに幅広く対応できる、とした。

    (大塚実)

    日本放送協会
    http://www.nhk.or.jp/

    情報処理学会第65回全国大会
    http://www.ipsj.or.jp/katsudou/taikai/65taikai.html

    情報処理学会
    http://www.ipsj.or.jp/

    新着記事

    特設サイトの情報

      人気記事

      一覧

        イチオシ記事

        新着記事

        特別企画

        マイナビニュースマガジン