The Registerはこのほど、「AI model collapse is not what we paid for • The Register」において、AIモデルの性能低下に関する懸念を示した。著者のSteven J. Vaughan-Nichols氏は、特に検索エンジンにおいて、AIが提供する結果の質が低下していると指摘し、これを「AIモデルの崩壊(model collapse)」と呼んでいる。
検索エンジンで進むAIの統合
現在、GoogleやBingなどの検索サービスでは、検索エンジンに対するAIの統合を積極的に進めている。例えばGoogleは、「生成AIによる検索体験(SGE: Search Generative Experience)」という名称で、検索に生成AIの「Gemini」を統合して結果の要約や追加質問の提案などを行っている。プログラミングのコード生成や料理レシピの作成など、複雑なタスクにも対応する。
BingではChatGPTベースのAIを統合し、チャット形式の検索によって回答の要約を得られるほか、追加の質問でより詳細な情報を引き出すこともできる。マルチモーダルにも対応しており、画像や表、グラフなど視覚的な形式での回答もできる。
しかしVaughan-Nichols氏は、これらのAIを活用した検索エンジンが、以前よりも信頼性の低い情報源からデータを取得する傾向が強まっていると指摘した。例えば、企業の財務情報を検索した際、公式な報告書ではなく、要約サイトなどから不正確な数字が提示されるケースが増えているという。
GIGOの連鎖がAIの品質を低下させる
Vaughan-Nichols氏は、このようなAIモデルの崩壊は「GIGO(Garbage In / Garbage Out)」の典型例であると説明する。すなわち、AIが自身の出力を再学習することによって、誤りが蓄積され、結果として精度や多様性、信頼性が損なわれるということだ。
このようなモデル崩壊には、エラーの蓄積、希少データの喪失、フィードバックループによる偏った出力の強化という、3つの異なる要因が関与しているという。この問題は検索サービスにとどまらず、生成AI全体の信頼を揺るがしかねない。
それでは、AIモデルが無視できなくなるレベルまで崩壊するにはあとどれくらいの期間がかかるのだろうか。Vaughan-Nichols氏は、OpenAI CEOのSam Altman氏による「OpenAIは現在、1日に約1000億語を生成している」という発言を引用した上で、「(崩壊までは)そう長くはかからないでしょう」と締めくくっている。
実際にそのような崩壊が起こるのかは分からないが、少なくとも、Vaughan-Nichols氏が挙げた3つの要因が、現在のAIモデルが抱える課題そのものであることは間違いない。AIの開発者や利用者は、この問題に対して真剣に向き合う必要があるだろう。