モデル・タレントとして活躍するユージと、フリーアナウンサーの吉田明世がパーソナリティをつとめるTOKYO FMのラジオ番組「ONE MORNING」(毎週月曜~金曜6:00~9:00)。2月21日(水)放送のコーナー「リポビタンD TREND NET」のテーマは「OpenAI社が開発中の新たな動画生成AI『Sora(ソラ)』」。情報社会学が専門の城西大学 助教・塚越健司さんに解説していただきました。対話型AI(人工知能)チャットサービス「ChatGPT」を開発したOpenAI社は2月15日(※現地時間)、新たな動画生成AI「Sora」の開発状況を公開しました。塚越:Soraは文章(テキストプロンプト/文章による指示)を書くと、それに基づき最長1分の動画をAIが自動で生成する、新たな動画生成AIです。OpenAIのサイトでさまざまな動画を公開しているのですが、これはすごいです。例えば「東京郊外を走る電車の車窓に映る様子」と入力すると、東京の郊外にそっくりの町を走る電車の窓に反射する乗客の表情まで表現されていて、すごいなと思います。他にも、「美しい雪の東京」「華やかな桜の花びらが風に舞う」などと入力すると、雪が路上に積もりつつも満開の桜が咲いた東京の街を生成し、少し上の位置からドローンで撮影したかのように、男女が桜並木を歩く姿が映し出されます。

Introducing Sora, our text-to-video model.



Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W



Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024特にインパクトがあったのが、「スタイリッシュな女性が、暖かく輝くネオンとアニメーションの街の看板で埋め尽された東京の通りを歩く。濡れた道路は、色とりどりの光の反射を生み出している……」という文章で作成したものです。夜の東京の新宿や渋谷のようなきらびやかな街を歩く女性の動画で、濡れた道路に反射する光などがすごくリアルです。

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

— OpenAI (@OpenAI) February 15, 2024ユージ:クールな女性が夜なのにサングラスをかけていて、そのサングラスにもキラキラした景色が映っていますね。塚越:動画生成AI自体は、いろいろと開発されてきており、例えば今年1月にGoogleは「Lumiere(リュミエール)」という動画生成AIを発表しました。とはいえ、生成できるのはまだまだ数秒程度の動画がほとんどです。映像の質も発展途上というなかで、今回のSoraは本当にすごいです。SNSでも話題沸騰中です。吉田:Soraは現在開発中ということですが、サービスとして提供する時期は、まだ決まっていないのですか?塚越:OpenAIは「まだ開発中」として一般公開はおこなっておらず、正式なリリース時期も明らかにしていません。OpenAIも「Sora」には弱点があることを認めています。例えば、(人がクッキーをかじる動画を生成しても)クッキーをかじった跡がクッキーに残らなかったり、先ほどの夜のネオン街の動画の看板の文字が(実際にある日本語ではなく)意味不明な"なんちゃって漢字"を映していたりと、そういう間違いがあるようです。しかし、技術としては、特にエンタメ分野においては十分に使えるレベルであることは間違いありません。例えば、AIで動画を生成して、あとで人間が動画を修正する方法もあるかなと思います。あるいは、動画に文章で追加指示(プロンプト)を打てば解決できるのでは? とも思いますが、まだまだ開発途中とのことです。OpenAIは、フェイクなどの問題を考慮して、利用者を一部の映画製作者やクリエイターに限定して提供するということです。精度が高くて本物と間違うレベルだからこそ、細かな点を間違うと「フェイク動画」になってしまうので、まだ一般公開しないのもこういうところに懸念があるからかなと思います。ユージ:精度が高いゆえに、「フェイク動画」が簡単に作れてしまうと、さまざまな問題が出てきそうですね?塚越:やはり、フェイク動画は問題です。当然のことながら、Soraは有名人や政治家のフェイク動画にも使えてしまいます。MicrosoftやMeta、OpenAIやTikTokなども含めた大手IT企業20社が2月16日(※中央ヨーロッパ時間)、アメリカ大統領選挙など、選挙での生成AIの悪用防止を共同で取り組むことを発表しています。動画生成AIでも、こうした点は今後問題になると思います。対応としては、動画生成AIを利用した場合は、動画の出所などを明示する「電子透かし」を搭載して、悪用を防止しようというものがあります。画像生成AIなどにもこうした機能はありますが、完璧ではありません。また、画像生成サービスで「宮崎駿風の画像」という指示を出して、ジブリ作品風の画像を生成するなど、いろいろとパクリができてしまうのではないか?という話がありましたが、今のところOpenAIでは「そのようなことはできません」と回答しています。こういった盗用対策なども、動画生成するうえで必要になってくるのではないかと思います。そう考えると、まださまざまな問題がありますが、技術としてはすごいです。フェイク動画の件をはじめ、OpenAIは詳細をあまり公開していない論文の技術内容の批判もありますが、それも含めて、これからも対応ができるのか見ていく必要があると思います。