マイナビニュースマイナビ
お知らせ
酷似サイトにご注意ください

潜在拡散モデルの仕組み。生成したい画像の指示文と、ノイズ(橙色)を入力とする。指示文は、文字埋め込み層によって単語ベクトル(青)に変換される。それぞれが潜在拡散モデルに入力され、ノイズから画像が復元される。最後に潜在空間のベクトルがデコーダによって画像の次元に拡張され、画像として出力される(出所:東大プレスリリースPDF)

24
記事ページに戻る

編集部が選ぶ関連記事

このカテゴリーについて

企業のR&D部門が開発した新技術の紹介や、宇宙、生命工学、物理学などのマニアックな科学系読み物を中心に構成。話題の科学者へのインタビューなども。