オンラインバックアップサービス企業のBackblazeは2月5日(米国時間)、「AI Reasoning Models: OpenAI o3-mini, o1-mini, and DeepSeek R1」において、過去数カ月間に起きた生成AIを取り巻く環境の変化について伝えた。

主にOpenAIおよびDeepSeekを取り上げ、違いや問題点などについて解説した。

  • AI Reasoning Models: OpenAI o3-mini、o1-mini、and DeepSeek R1

    AI Reasoning Models: OpenAI o3-mini, o1-mini, and DeepSeek R1

生成AIの今

Backblazeは基本事項として、OpenAIおよびDeepSeekが提供する現在利用可能な生成AIサービスの種類、およびその価格を紹介。その概要は次のとおり。

OpenAI o1-preview

物理学、化学、生物学など難しいベンチマークタスクをターゲットにする推論モデル。費用は100万入力トークンあたり15ドル、100万出力トークンあたり60ドル。

OpenAI o1-mini

コーディングタスクをターゲットにする推論モデル。費用は100万入力トークンあたり3ドル、100万出力トークンあたり12ドル。o1-previewの1/5の費用となっている。

DeepSeek R1

数学、コーディングタスクでOpenAI o1シリーズと同等の性能があるとされる推論モデル。費用は100万入力トークンあたり0.14ドル、100万出力トークンあたり2.19ドル。OpenAIより圧倒的な安さを売りにする。

いずれも推論モデルに分類された生成AIサービスだ。OpenAIはこれら以外のサービスも提供しているが、Backblazeはこれらに限定して議論を行っている。

なお、ここで言う推論モデルとは、回答に思考時間を確保することでより高度な問題解決を可能にしたチャットボットを指している。推論といっても人間のように「考えて」いるわけではなく、意思決定、自己改善などを繰り返す思考連鎖により理想的な回答に近づける処理が行われる。

生成AIの課題

Backblazeによると、推論モデルは従来のLLM(Large Language Model:大規模言語モデル)が抱えている課題を、ほぼそのまま抱えているとされる。具体的な課題としては複雑な推論の失敗、トレーニングの透明性の欠如、認知バイアスの問題などがあるという。

また、DeepSeek R1はモデルのトレーニングの過程(蒸留)でOpenAIのモデルを利用したと指摘されており、不正な手段により開発された製品の可能性がある(参考:「DeepSeekの脱獄に成功、システムプロンプトを抽出 | TECH+(テックプラス)」)。

利用者は何を選択すべきか

Backblazeは現在の高度で不完全な生成AIを利用する上で、重要なポイントは2つあると指摘している。その概要は次のとおり。

  • 1つの生成AIサービスに固執しない。新しい生成AIサービスの発見およびテストを継続し、その都度最適なサービスを活用する
  • 新しい生成AIサービスに対応し続けられるデータストレージを活用する。特に信頼性、アクセスのしやすさ、価格に優れた製品が推奨される

AIの進化の速度は非常に早い。半年後には聞いたこともないサービスが主流になっている可能性もある。企業にはこの進化の流れに取り残されないよう社内環境を整備し、積極的にAIを活用することが望まれている。