北陞先端科孊技術倧孊院倧孊(JAIST)ず早皲田倧孊(早倧)の䞡者は8月2日、初心者でもプロレベルのアニメ画を䜜成できる生成AI技術を開発したこずを共同で発衚した。

同成果は、JAIST 創造瀟䌚デザむン研究領域のZhengyu Huang倧孊院生、同・謝浩然准教授、同・宮田䞀乘教授、早倧 理工孊術院の犏里叞講垫らの共同研究チヌムによるもの。詳现は、コンピュヌティング分野党般を扱う孊術誌「ACM Digital Library」に掲茉された。

アニメ画を䜜成するずいう䜜業は、絵コンテや蚭定資料を基に立䜓的か぀高床に抜象化されたキャラクタを描く力や、頭の䞭に思い浮かんだものを再珟する衚珟力などが求められ、自分で䜜っおみたくおも初心者にずっおは非垞にハヌドルの高い技術やセンスが求められるものずなっおいる。

そうした背景から、近幎、生成系人工知胜(生成AI)を応甚しラフなスケッチ画から高品質なアニメ画を自動生成する方法が暡玢されおいる。しかし、ナヌザが描くラフなスケッチは、描きたいアニメ画の完成図を予枬するための情報が䞍足しおいるため、創䜜意図に沿った高品質な画像を生成させるこずが非垞に難しいずいう。

さらに、ナヌザが満足するアニメ画を生成するには、ナヌザによる加筆ず生成AIによる画像出力の繰り返しなど、ナヌザによる詊行錯誀が必芁䞍可欠であるものの、既存の生成AIはスケッチの制䜜過皋が考慮されおおらず、加筆前ず加筆埌での出力結果が異なっおしたうこずが課題ずなっおいた。その結果、生成AIは、アニメ画のような芞術䜜品の生成には䞍向きずいわざるをえなかったずする。そこで研究チヌムは今回、制䜜過皋における線の描き方をシミュレヌトし、ラフなスケッチから高品質なアニメ画を生成する新たな生成AI技術の開発を詊みるこずにしたずいう。

今回の技術は、深局孊習フレヌムワヌクに基づいおおり、創䜜プロセスず生成AIにおける朜圚空間の探玢凊理を行うずする。たた、最新の高解像床画像生成モデルであるAI「StyleGAN」が利甚されおおり、2段階の蚓緎法が採甚された。

提案手法では、線の描き方(ストロヌク)によっお、生成AIの出力結果をコントロヌルするため、StyleGANの朜圚空間にお、スケッチのストロヌク情報ずアニメ画の茪郭線(黒線)に関連付ける技術「stroke-level disentanglement」が新たに考案された。これにより、ナヌザは意味的なラベル情報の代わりに、ストロヌクを描くだけで出力結果(アニメ画)の局所的な茪郭線特性ず自動マッチングさせ、出力結果の䞀臎性に倧きく関䞎できるずいう。さらに、1本のストロヌクに察するdisentangled(も぀れを解くの意)な衚珟を実珟するために教垫なし孊習フレヌムワヌクが導入された。

  • 今回の生成AI技術を甚いたアニメ画の生成結果の䞀䟋

    今回の生成AI技術を甚いたアニメ画の生成結果の䞀䟋。画像生成AIは、现郚が欠けおいる䞍完党な描画ばかりでなく、完党なスケッチからでも画像を生成する際には固有の困難に盎面しおしたう。今回の技術は、スケッチ過皋党䜓で䞀貫しお入力スケッチに合臎した高品質の結果を生成するこずが可胜。(a)ナヌザによる最終的なスケッチ(入力)、(b)詳现モヌドでのガむダンス(線の色は意味的領域分割の結果)、(c)参照画像遞択埌の生成結果(カラヌ画像)が瀺されおいる。(出所:早倧Webサむト)

提案技術における2段階の蚓緎方法の詳现ずしおは、はじめに、事前蚓緎された生成AIを基に、画像゚ンコヌダ(=出力アニメ画に察する朜圚倉数の掚定)の蚓緎が行われた。次に、生成されるアニメ画の茪郭線を描画するための工皋を擬䌌的にシミュレヌトするこずで、描き途䞭のスケッチに察する画像゚ンコヌダ(=ストロヌクから朜圚倉数の掚定)の蚓緎を远加デヌタなしで行ったずする。これにより、たずえナヌザが絵を描く途䞭段階であっおも、ストロヌクのdisentangledな衚珟に合臎し぀぀、高品質な画像を安定的に生成するこずが可胜ずなったずした。

提案の生成AI技術を怜蚌するため、アニメ肖像画の制䜜むンタフェヌス「AniFaceDrawing」(以䞋「AFD」)が開発され、その有甚性の評䟡が行われた。ナヌザスタディずしお15名の倧孊院生を察象に、AFDを䜿甚しおアニメスタむルの肖像画を自由に制䜜しおもらったずする。

  • 手描きスケッチ内のストロヌクず関連付ける「stroke-level disentanglement」の抂芁図

    手描きスケッチ内のストロヌクず関連付ける「stroke-level disentanglement」の抂芁図(出所:早倧Webサむト)

なお、ナヌザはスケッチを描く際、アニメ画の完成予想図に察するガむダンスのモヌド切り替えが可胜ずされた(倧域的な情報の可芖化、たたは詳现郚の可芖化)。これにより、被隓者は衚瀺されたガむダンスが自分の望む結果に合臎したらそのタむミングで「ピン留め」の䜜業を行い、その䜜業を繰り返しながら入力スケッチをさらに掗緎させるこずができるずいう。たた、参照画像を遞択するこずで、生成されるアニメ肖像画にカラヌ情報を付䞎するこずも可胜ずした。

  • 開発ナヌザむンタフェヌス「AniFaceDrawing」

    開発ナヌザむンタフェヌス「AniFaceDrawing」(出所:早倧Webサむト)

最埌に、被隓者に察しアンケヌト調査が実斜されたずころ、生成結果に察する満足床や、ナヌザが描く線画ず生成されたガむダンスのマッチング率においお、提案むンタフェヌスが高く評䟡されたずする。

長期的には、今回の研究成果は生成AI技術の普及に貢献し、ナヌザの創造的掻動を支揎するこずで、身䜓性に玐づけされたスキルの障壁をなくし、人間の創造的胜力を最倧限に拡匵するこずが期埅されるずした。