鮮烈な中国AIスタートアップDeepSeekの生成AIデビュー、世界中の半導体関連企業に衝撃

中国の創業1年余りの人工知能(AI)開発スタートアップである「DeepSeek(ディープシーク)」が安価で性能の低い半導体を使って低価格で開発した生成AIアプリが米国のApple StoreのiPhone向けダウンロード数でChatGPTを抜き、低コストで開発した大規模言語モデル「DeepSeek-R1」の性能が米国製の巨費を投じた競合モデルを上回ったとして、シリコンバレーに衝撃が走っていると多数の欧米メディアが一斉に報じている。米国のほか、オーストラリア、カナダ、中国、シンガポール、英国などのApple Storeでダウンロード件数1位を獲得したという。

DeepSeekショックで世界中の半導体関連株が急落

米国のAI産業の優位性が揺らぐとの警戒感から、1月27日(米国時間)に世界中の株式市場が反応し、NVIDIAやBroadcomの株価が10％以上下げたのをはじめ世界中のAI関連のIT企業や半導体および関連企業の株価が軒並み下落、さらにはDeepSeekがNVIDIAを中心とする先端プロセスを利用した半導体を使っていないらしいとの情報でASMLの株価も急落。日本でも、アドバンテストやソフトバンク株が急落した。

DeepSeekは2023年に、中国ヘッジファンドであるハイフライヤー・クオント(幻方量化)の最高経営責任者(CEO)である梁文峰氏によって設立された。梁文峰氏は1985年に広東省で生まれた、浙江大学で電子工学および情報工学の学士号と修士号を取得した。従業員のほとんどは、中国内の一流大学出身の若手だという。梁氏は、NVIDIAとそのAIチップを基盤とするエコシステムと同様なシステムを、中国国内に構築する必要性から独自の安価だが高性能な生成AIモデルを開発していると述べている。

世界トップクラスの性能を示したDeepSeek-R1

人間の思考を模倣するように設計された推論モデル「DeepSeek-R1」はオープンAIの最新バージョンと同等の性能を提供すると同社は主張しており、この技術を使用したチャットボット開発に興味のある個人に対して、その上に構築するためのライセンスを付与しているという。

DeepSeekによると、R1は数学的タスクのAIME 2024、一般知識のMMLU、質問応答性能のAlpacaEval 2.0などいくつかの主要なベンチマークにおいて、ライバルモデルと同等か、それ以上の性能を発揮しているという。また、カリフォルニア大学バークレー校が運営する「Chatbot Arena」というランキングでも、トップクラスの性能を誇っているという。

大規模言語モデルの開発者は、データ量や計算資源などが大きいほど性能が高まるという「スケーリング則」を根拠に、OpenAIやソフトバンクグループ(SBG)などは1月、AIの開発インフラに5000億ドル規模の資金を投じると表明した。Metaも2025年の設備投資額が前年比で約6割増の600億〜650億ドルになる見通しだと明らかにした。これに対して、DeepSeekは1つのモデル開発にかかった費用が約560万ドルで、開発期間は約2か月だったと説明している。このモデルの優れた性能は、AI開発各社がNVIDIAのような企業から最新かつ強力なAIアクセラレーターの入手に多額の資本を投じる必要があるのかという疑問を生じさせている

米国政府の対中AI輸出規制は逆効果か？

米国政府は米国と中国の技術覇権争いの要となるAI分野で中国が優位に立つことを阻止しようと、GPUなどのハイエンド技術の中国への輸出を禁止した。いわばバイデン前大統領の置き土産である輸出制限はDeepSeekが示すような画期的な進歩を阻止することを目的としたものだった。しかし、DeepSeek-R1の登場は、中国のAIエンジニアが限られたリソースで効率性の向上を追求し、米国の対中規制の影響を回避できていることを示唆している。

New York Timesは、「DeepSeekのAIの性能は、米国政府の貿易規制が意図せぬ結果をもたらしているのではないかという疑問を投げかけている。米国の規制によって中国の研究者たちは創意工夫を強いられ、ネット上で自由に使えるさまざまなツールを駆使しようとしているためだ」と米国政府の規制が逆効果になってしまっていると主張している。DeepSeekがどのようなAIトレーニング用ハードウェアを利用しているのかはあきらかにされていないが、同社が示した能力は、米国の規制が効果を発揮しないどころか、中国のAI開発を促進させていることを示唆している。利用する米国民が急増する中国製生成AIアプリに対して、トランプ大統領が、TikTok同様に、どのような見解を表明するか注目されている。