iPhone OS 3.0の仕様が明らかになりました。しかし、この発表はいわば「序章」です。ハードウェアの変更について言及がなかったのですから。ゲーム機としての性能向上に力点が置かれていると予想していますが、果たして……6月頃に焦点をあわせ、情報収集に努めたいと思います。

さて、今回は「iPod shuffle」。操作方法などUI面の紹介はさておき、話題の新機能「VoiceOver」について、あれやこれや試した結果をご報告する。

第3世代のiPod shuffleが登場、話題の「VoiceOver」を探る

「VoiceOver」はどこにある?

初めてiPod shuffleをiTunesに接続し、セットアップの画面で「VoiceOverを有効にする」を選択すると、Appleのサーバから「VoiceOver Kit」がダウンロードされる。これが曲名やアーティスト名を読み上げる機能の実体で、今回のテーマだ。

ユーザ登録完了後に「VoiceOverを有効にする」をチェックすると、パッケージのダウンロードが始まる

このVoiceOver Kit、現時点では単独で入手できない。iTunesをv8.1にバージョンアップし、iPod shuffleのユーザ登録を済ませて機能を有効にして初めて、Appleのサーバからパッケージがダウンロードされる仕組みだ。

インストールされたものがパッケージ (.pkg) かどうかの確信はなかったが、/Library/Receiptsディレクトリを探してみると、ビンゴ。「VoiceOverMacPPC.pkg」なるパッケージを発見、bomファイル (パッケージの内容物が記載されたカタログファイル) を参照することにより、VoiceOver Kitの実体が「/Library/Application Support/iTunes/iPodVoiceOver.framework」であると判明した。

VoiceOver Kitの正体「iPodVoiceOver.framework」

読み上げ音ファイル、ここにあります

VoiceOverは、iPod shuffle向けに新開発された音声合成技術「Text to Speech」が基本だ。これをiTunes側から必要に応じて呼び出し、曲名 / アーティスト名を言語に応じて合成、iPod shuffleに楽曲とともに転送される。これが再生ボタンのダブルクリックにより呼び出され、人間の声として聞こえるという仕組みだ。つまり、合成された"読み上げ音ファイル"はiPod shuffleのどこかに保存されていることになる。

iPod shuffleをマウントして探してみたところ、/Volumes/ボリューム名/iPod_Control/Speakable/Tracksに、いくつかのWAVEファイルを発見。再生してみるとビンゴ、このWAVEファイル群が"読み上げ音ファイル"だった。ファイルサイズは、平均で100KBといったところ。先日Appleの担当者に行ったインタビューでは、取るに足りないファイルサイズとのことだったが、予想よりかさばるんじゃない? というのが筆者の本音だ。

読み上げ音はWAVEファイルとしてiPod shuffleに転送されている

いろいろ試してみました

そのVoiceOver、最大の問題は「期待どおり動作するかどうか?」。基本はText to Speechということは理解できたが、果たしてアーティスト名の所属国籍が正しく判定されるか、アーティストの国籍は日本だが曲名は英語といった合わせ技の場合どうなるのか、一抹の不安が残る。うっかり人前で笑ってしまわないために、イントネーションの微妙さ加減もチェックしておきたい。

そこで自分のサウンドライブラリから、英語圏以外に属すアーティストの10曲を選び出し、iPod shuffleへと転送してみた。検証してみたかったことは、「人名 (漢字) や四字熟語を正しく読めるか」「記号はどう扱われるか」「言語が混在する場合どうなるか」「サポート外の言語はどうなるか」などなど。選んだ曲とその結果は、下表のとおりだ。iPod shuffleから取り出したWAVEファイルを、AACでエンコードしたものを掲載しておくので、聴いてみてほしい。

まず人名だが、日本人アーティストは不振に終わった。「四人囃子」は「よにんばやし」とはならず、「久住小春」も「くじゅうこはる」に。ただし、「starring」は「スターリング」として日本語風に読み上げられ、「一触即発」も問題なし。人工的なイントネーションも鼻にはつくが許容範囲内。70年代プログレと最近のアイドルの曲 (これは5歳になる娘の選曲なので念のため) というチョイスはともかく、よほど突拍子もない"読み"の曲名 / アーティスト名でなければ、十分実用に耐えうるのではないだろうか。

一方、アーティストが属す国籍 / 言語と曲名の言語が異なる場合、うまく行かないことがあるようだ。筆者のテストでは、オランダ人のJan Akkermanによる「Gate to Europe」という曲は、英語読みが妥当であるところがオランダ風に読み上げられてしまった。タイフォンというフランス (主要メンバーがベトナム人なので微妙だが) のバンドは、「Goin' Away」という曲名に引きずられたのか、バンド名も英語読みになってしまった。

VoiceOverで使用する言語は手動で指定できるが、曲名とアーティスト名の言語が異なる場合には問題が生じる

ちなみに、VoiceOver KitがインストールされたiTunesを使用していれば、曲のプロパティで「オプション」タブを表示すると、「VoiceOverの言語」なるプルダウンメニューが見えるはず。これを操作すれば、音声合成に使う言語を指定できるが、アーティスト名と曲名の言語が異なる場合は上述の問題を避けられない。この問題が今後どのように解決されるか、注目して行きたい。

■表: VoiceOverのテストに使用した曲一覧
国籍 曲名 アーティスト名 読み上げられた内容 備考
日本 一触即発 四人囃子 いっしょくそくはつ、よんにんはやし 正しくは「よにんばやし」
日本 ハッピー☆彡 月島きらり starring 久住小春(モーニング娘。) ハッピーほしさん、つきしまきらり スターリング くじゅうこはる もーにんぐむすめ 「ほしさん」は発音しない (はず) 。正しくは「くすみこはる」
オランダ Gate to Europe Jan Akkerman ハーズトゥユーロプ、ヤンアッカーマン 曲名がアーティスト名にあわせオランダ語読み (?) に
フランス Le Photographe Exorciste Atoll ルフォトグラフェエグゾシ、アトール 特に問題なくフランス語で読み上げられた
フランス Kohntark Magma コンタリッキ、マグマ 便宜上フランス語に分類したが、本来はコバイア語という独自言語のため正解かどうか不明
フランス Goin' Away Tai Phong ゴーイングアウェイ、タイピーエイチオン アーティスト名が曲名にあわせて英語読みに、正しくは「タイフォン」
ベルギー Presage Univers Zero プレセージ、ユニバースゼロ 正しくは「ユニベルゼロ」
イタリア Il Bandito Del Deserto Area イルバンディトデルデゼルト、アーレア 問題なし
イタリア Terminal Arti + Mestieri テルミナル、アルティプメスティエリ 正しくは「アルティエメスティエリ」
ハンガリー Nem Tudom A Neved Omega ネントゥドムアニベ、オメガ 正しくはマジャール語読みとなるはずだが、どの言語で読み上げられたか不明