米World Labsは12月2日(現地時間)、1枚の画像から相互作用可能な3D世界を生成する大規模ワールドモデル(Large World Models、LWM)の初期成果を公表した。World Labsは空間インテリジェンスAIの開発を目的に、“AIのゴッドマザー”と称されるフェイフェイ・リー氏が2024年春に設立した。Andreessen Horowitz、NEA、Radical Venturesなど、著名なベンチャーキャピタルファームが資金を提供している。

現在、画像を3Dモデルや3D環境に変換するAIシステムはすでに複数存在する。また、現実世界の物理的・環境的特性を学習し、それをシミュレーションするAIモデルが生成AIの新たなカテゴリーとして注目されている。この分野では、ゲームや3D環境を再現する成果が発表されているものの、現時点ではシミュレーションにアーティファクトや不整合といった課題が残る。例えば、10月にイスラエルのAI企業Decartが発表したMinecraft風の“オープンワールド”AIモデル「Oasis」は、解像度が低く、空間の一貫性が欠如している。

これに対し、World LabsのLWMは、矛盾のない高度な相互作用を可能にする技術を開発している。同社は「あらゆる画像に入り込んで、3Dで探索することができる」と述べ、1枚の画像から生成された3D空間を体験できるデモを公開している。このデモでは、入力画像と比較して多少絵画的になるものの、奥行きのある空間がブラウザ内でリアルタイムにレンダリングされる。

多くの生成モデルがピクセルを予測しているのに対し、World Labsのモデルは3Dジオメトリの基本的な物理ルールに基づき3Dシーンを予測する。これにより、シーンが過度にファンタジックになることなく、現実感のある奥行きを伴った空間を移動できる。建物の陰に隠れているものを覗き込んだり、咲いている花の細部を観察したりするなど、リアルタイムの制御が可能だ。一度生成された世界は3D空間として保持されるため、視点を移動させたり、移動後に元の位置に戻ってもシーンが変化することはない。

このモデルはまだ初期プレビューであり、動ける範囲は狭く、レンダリングエラーが発生することもある。World Labsは生成世界の忠実度とサイズの向上に取り組み、製品化を目指す。3Dワールド生成は、他のAIツールと組み合わせて新たな体験を作り出すことが可能であり、同技術を活用した新たな体験を模索するため、限られた数のクリエイターに早期アクセスを提供している。その一例として、エリック・ソロリア氏(映像制作、ビデオ編集、モーショングラフィックス、VFX、AIアニメーションなど多岐にわたるスキルを持つコンテンツクリエイター)が、自身のクリエイティブワークフローの中で、World Labsの技術を用いて、シーン内でのキャラクターの演出や正確なカメラの動きの指示を容易にする方法を紹介している。