1月20日、中国初の生成AI「DeepSeek R1」登場し、そのコストパフォーマンスからNVIDIAなどの株価が大きく下落しました。しかし、そのインパクトも10日ほどで落ち着きました。1月末にOpenAIが「o3-mini」をリリースしたためです。→過去の「柳谷智宣のAIトレンドインサイト」の回はこちらを参照。
o3-miniは高度な推論能力を備えているのに動作が早く、複雑な問題を解けるのです。o3-miniを無料プランでも利用できるようにしたのは、DeepSeek対策かもしれません。
o3-miniもすごかったのですが、数日後の2月2日、OpenAIは畳みかけるようにChatGPTの新AIエージェント「Deep Research」をリリースしたのです。o3-mini技術を利用し、複雑な調査タスクを効率的に処理できるというのです。
リサーチは検索特化の「Felo」や「Perplexity」「Genspark」などがすでに手掛けている機能です。注目度が高く、鳴り物入りで導入されたもののコストパフォーマンスや性能がライバルに及んでいなかった動画生成AI「Sora」や検索機能「ChatGPT search」を見るに、少々不安でしたが、杞憂でした。
OpenAIのDeep Researchの性能はすさまじいものがあります。今回は、注目のDeep Researchについて詳しく解説します。
今はChatGPT Proユーザーのみが利用できる
今のところ、Deep ResearchはChatGPT Proユーザーのみが利用可能となっています。ChatGPT Proは月額220ドル(1月から消費税が加算)の上位プランとなっており、そのうえ月あたり100回までの利用制限があります。
現在は、Web版のみとなっていますが、今月中にモバイルアプリとデスクトップアプリにも展開されます。将来的には月額20ドルのChatGPT PlusやTeamプランにも拡大され、さらには外部のデータソースに接続することもできるようになります。
Deep Researchは、その名の通り深くリサーチを行うことに特化しており、膨大なテキストデータから必要な情報を抽出・分析するために設計されたAIエージェント。研究論文や専門文献、ニュース記事、SNSなど、膨大な情報源にアクセスし、それらを要約・整理してユーザーにわかりやすい形で提示してくれるのが特長です。
「Humanity's Last Exam」というテストでは精度26.6%というスコアを出しました。これは、言語学からロケット科学、古典から生態学まで、100を超える科目にわたって、3000以上の多肢選択式および短答式の質問で構成されているテストです。OpenAI o1と比較すると、化学や人文科学、社会科学、数学で大きくスコアがアップしていたそうです。
特に学術的な研究分野や市場リサーチ、特定のトピックに関する深堀りが求められる業務などにおいて活用されると紹介されましたが、そんなことはありません。ライターの執筆作業にも個人のネットショッピングにも活用できます。実際、OpenAIの製品紹介でも、日本でスキー板を買う時に利用していました。
従来のリサーチ作業では、論文や記事を数多く手動で探し、論点をまとめ、データを整理し、検証作業を行う必要がありました。しかし、Deep Researchを活用することで、作業を大幅に効率化できるのです。
「◯◯についての最新研究は?」や「この市場の競合はどのような戦略を取っている?」などと尋ねるだけで、関連する論文や記事の要点を集約して提示してくれるのです。さらに、ChatGPTの性能をフル活用し、専門性の高い分野でも高度な文献理解・要約をしてくれます。
Deep Researchの使い方は簡単です。プロンプトの入力欄にある「詳細なリサーチ」ボタンをクリックしてオンにします。この状態で、プロンプトを入力すればOKです。「検索する」ボタンとは同時に利用できません。
AIエージェントビジネスに関するレポートは7分、2万3981文字
まずは、最新情報を調査し、レポートを生成してもらいましょう。今年はAIエージェント元年になると予想されているので、そこに参入すると仮定してどんなエージェントを開発すればいいのか調べてもらいました。
-
プロンプト
これから独自のAIエージェントを開発し、ビジネス化していこうと思います。現状、グローバルでのAIエージェント活用事例を精査し、どの領域でどんなプロダクトにすればいいか調査してレポートを作成してください。
「詳細なリサーチ」を有効にしてプロンプトを入力すると、すぐに「いくつか確認させてください」と5つの質問が返ってきました。これは、よりよい回答を生成するためにAIが考えて、追加情報を求めているのです。もちろん、「適当に考えて」と返すこともできますが、きちんと答えると、その分クオリティの高い出力が得られます。
Deep Researchの思考が始まると右ペインでどんなサイトを検索し、どんな内容を収集しているのかを確認できます。今回の思考時間は約7分。海外メディアを中心に18件のソースを分析し、「AIエージェント活用事例とBtoB市場分析」と題するレポートを作成してくれました。その文字数、2万3981文字。文字数が多ければ偉いというわけではありませんが、これまでにない出力ボリュームです。
前段のトレンドや既存プレーヤーの分析は、そのままAIエージェントの解説記事になりそうなほどのクオリティでした。特定領域については最新情報を網羅し、読みやすくまとめてくれ、「顧客接点領域(CS・営業・マーケ)」と「社内効率化領域(HR・IT・知識管理)」「専門職支援領域(医療・金融・開発)」「マルチエージェント活用領域」の4つを勧めてくれました。
そのうえで「まだ十分開拓されていない市場や新しい応用分野」も考えてくれたのがすごいところです。まさに、こちらが意図した回答と言えます。
セルフサービス型のチャットボット構築ツールなどの低コストのAIエージェントや日本特有の商習慣・敬語文化に対応したチャットボットなどのローカライズされたAIエージェントなどをはじめ、経営層向けのAI戦略アシスタント、プロジェクト管理エージェント、クロス産業・複合ソリューションなどを提案してくれました。
実際に、AIエージェントビジネスに参入しようと考えている場合でも十分に参考になるレポートです。これが7分で手に入るのですから、革命的です。ちなみに、同じくChatGPT o3 mini-highで「検索する」機能を使って同じプロンプトを入れると、数秒で4678文字の出力が得られました。これでも十分すごいのですが、比べるとDeep Researchの方が格段に解像度が高くなっています。
iPhone16シリーズと15シリーズの比較原稿は8分、4万4564文字
次は、ダイレクトに原稿を書いてもらいます。検索しないとわからないスマートフォンのスペックを詳細に比較した記事を作ってもらいました。制作時間は8分で、28の情報源をチェックし、4万4564文字のテキストが生成されました。
発売日から価格、各種スペックなどきちんと網羅されています。あちこち抽出してファクトチェックしてみましたが目立ったミスはありませんでした。箇条書きのようなところも多く、原稿としてそのまま納品することはできませんが、下書きとしては十分すぎるほどです。
数年前まで、この比較表を作るのにどれだけ時間をかけていたのか、そしてそれでもミスが多発していたことを考えるとAIは恐ろしい進化を遂げました。若き日の自分に使わせてあげたいと心底思います。
-
プロンプト
iPhone 16(Plus/Pro/Pro Max)とiPhone15シリーズの詳細な比較記事を書いてください。発売日、価格、すべてのスペックを網羅し、正確に比較してください。
ちなみに、この出力をChatGPT Proで使える「o1 Pro mode」にコピペし、リライトしてもらったところ、原稿の体裁になりました。やや数値に細かい文章になっていますが、あやふやな文章よりよっぽどましです。情報さえ入っているなら、日本語を修正すればいいだけです。
これは、網羅的に情報をリサーチしてくれたDeep Researchの出力があるおかげです。通常の検索機能や他の検索特化生成AIではこうはいきません。ライターとしての働き方も、今後は大きく変わっていきそうです。
Deep Researchはとにかくすごい出力が得られます。スモールビジネスのアイデアを100個出してもらったり、子供と体験すべきイベントを100個出してもらったり、これから取材する業界の概要を把握したりとアイディア次第でとてつもない情報が手に入ります。
もちろん、まだ完璧ではなく、ハルシネーションが混じったり、最新情報が抜けたりします。例えば「ChatGPT、Gemini、Claudeの最新の比較記事」といった内容を書かせても、ツッコミどころが満載です。先週出たばかりの情報などは流石に追いつかないようで、やはり、ネット上に情報が多くある事柄に関してのリサーチに向いているようです。
リリースされたばかりのDeep Researchでこのレベルなら、今後性能が向上すると、一部のホワイトカラーの仕事を奪っていくことは間違いありません。リサーチ業務を行うようなライターやコンサルタント、パラリーガル、税務アドバイザー、データアナリスト、市場調査員などは、大きな影響を受ける可能性があります。
とは言え、AIを駆使することができれば、これらの職種でも逆に仕事の幅を広げ、単価を上げることもできます。筆者はフリーランスライターですが、すでに月額220ドルのChatGPT Proを手放せません。自分の業務に合いそうだなと思ったら、ぜひ1カ月でも試してみることをお勧めします。