推論するChatGPT o1-previewで計画立案や課題解決をするプロンプト

2024年9月にOpenAI o1-previewとo1 miniがリリースされました。GPT-4oよりも複雑なタスクを推論し、科学や数学、コーディングに強くなっています。その分、出力までに時間がかかるようになっているのが特徴です。→過去の「柳谷智宣のChatGPTプロンプトクリエイティブラボ」の回はこちらを参照。

OpenAIのリリースによると、GPT-4oに国際数学オリンピック(IMO)の予選試験を解かせたところ正答率は13%でしたが、この推論モデルは83%正解したそうです。コーディング能力はCodeforcesコンテストで評価され、89パーセンタイルのスコアを獲得しています。

新モデルは有償のChatGPT PlusおよびTeamsユーザー向けに公開されており、OpenAI o1-previewは今のところ週に50回、軽量版のo1-miniは1日に50回利用できます。APIによる有償利用も可能で、o1-miniはo1-previewよりも80%安くなっています。

ただし、現時点では「ティア4」以上のユーザーしかAPI利用できません。ティアはユーザーレベルのようなもので、これまでに支払った金額により、5段階設定されています。

今回は、ChatGPT o1を活用するためのプロンプトを紹介します。従来のChatGPTで活躍したプロンプトが動作しないだけでなく、かえって出力のクオリティを損なうこともあるので注意が必要です。

ChatGPT o1-previewは推論が得意だ

飲食店の開業計画を立案してもらう

OpenAI o1-previewは画像の入出力や関数を利用することはできません。まだβ版で、あくまでもテキストのやりとりがメインです。

プロンプトを入力すると、そこからプロンプトを分解し、推論し、複数のアプローチを考えます。この途中の推論部分は破棄されて、最終的なアウトプットのみが出力されます。API利用の場合は、この推論部分のトークンも課金されます。

ちなみに、コンテキストウィンドウは従来と同様12万8000トークンですが、出力トークンは推論を含めてo1-previewが3万2768トークン、o1-miniが6万5536トークンと大きくなっています。学習に使ったトレーニングデータは2023年10月までとなります。3番の区切り文字を利用することだけは従来と共通していますが、そのほかは注意する必要があります。

o1-previewの本領を発揮させるためには、簡単なプロンプトを入力することが重要です。従来のように、「ステップバイステップで考えてください」といった指示を入れると、パフォーマンスが落ちる可能性があります。OpenAIは以下の4つのアドバイスを公開しています。

1. プロンプトはシンプルかつ直接的なものにする
詳細なガイダンスを必要とせずに、簡潔で明確な指示を理解して応答することに優れています。

2. 思考の連鎖を促すプロンプトは避ける
内部で推論を実行するため、「段階的に考える」または「推論を説明する」ように促す必要はありません。

3. 明確にするために区切り文字を使用する
三重引用符、XML タグ、セクションタイトルなどの区切り文字を使用して、入力の異なる部分を明確に示します。

4. 検索拡張生成(RAG)で追加コンテキストを制限する
追加のコンテキストまたはドキュメントを提供する場合は、もっとも関連性の高い情報のみを含めます。

複雑な思考ができるとのことなので、計画立案を試してみましょう。まずは、飲食店の開業計画を立ててもらいました。AIモデルの選択メニューから「o1-preview」を選択し、プロンプトを入力します。

しばらく考えた後に出力が始まります。「思考時間:●秒」という部分をクリックすると、ChatGPTがプロンプトを分析し、展開している様子を確認できます。

AIモデルの選択メニューから「o1-preview」を選択

プロンプト

東京でダイニングバーを開業する際にしなければならない作業をすべて教えてください。
＃＃＃条件
開業資金は2000万円
席数は10～30席を想定
雇用する従業員は2人
出力

2～4ポイントをリストアップしてくれた

ビジネスプランの作成からグランドオープン、運営後の管理まで、14項目にわたり、それぞれ2～4ポイントをリストアップしてくれました。シンプルなプロンプトなので一般的な内容ですが、それでも実店舗をオープンする手順とほぼ変わらない内容が得られました。

GPT-4oで同じプロンプトを入れてみたところ、8項目の出力が得られました。o1-previewの出力と比べると、市場調査や法人設立の項目がなく、ざっくりとした内容になっています。o1-previewはブレイクダウンしており、より具体的なリストになっていました。

GPT-4oもとても賢いので、内容そのものが大幅に異なっているわけではありません。しかし、o1-previewの方がいい感じになっていることは確かでした。

困難な課題解決にチャレンジしてもらう

o1-previewは困難な課題解決も得意です。試しに「火星移住プロジェクトの詳細な計画を立案してください」と入力したところ、タイムラインや技術要件、輸送計画から課題、予算まで包括した計画を生成してくれました。驚くほどリアリティがあったので、試しにSF小説のネタを考えてもらいました。

「斬新な切り口のSF小説の骨子を考えてください」とだけ入力したところ、どこかで見たようなあらすじが生成されました。オリジナリティを出すために、少しはアイディアを提示したほうがよさそうです。

ここでは、コンピュータが未来を予測できるようになった世界、という設定を与えてみました。

プロンプト

無限に近い計算能力のコンピュータが開発され、1万年先までの大まかな未来が予測できるようになった、という設定の世界で、人類が絶滅する未来を回避するために研究者が立ち上がるというSF小説の詳細な骨子を考えてください。
出力

全体の構成からテーマ、登場人物、キーポイントまで詳細な出力が得られた

全体の構成からテーマ、登場人物、キーポイントまで詳細な出力が得られました。そのまま小説や映画のたたき台にできそうな感じです。

次に、実際の社会課題にチャレンジしてみました。大きな社会問題であるいじめを解決するための施策を考えてもらいました。「学校内のいじめ問題を解決するための施策を考えてください」だけだと、施策は提示されたのですが、何が目的なのか、どう実施すればいいのか、がわかりませんでした。そこで、欲しい情報をプロンプトに追記しました。

プロンプト

学校内のいじめ問題を解決するための施策を考えてください。詳細な課題のリストアップや施策のスケジュールなども含めてください。
出力

課題と施策、タイムスケジュールといった包括的な計画を生成した

その結果、課題と施策、タイムスケジュールといった包括的な計画を生成できました。このレベルの成果物が1分もかからず得られるのは驚異的です。人間はここからブラッシュアップすればいいだけなので、大幅な効率アップになりますし、抜け漏れがなくクオリティも高まります。

計算や論理クイズを解けるように

ChatGPTが登場したころは、計算や論理問題が苦手と言われていました。どんどんAIモデルが改良され、簡単な計算はできるようになり、今では正確に答えられるようになっています。

今のChatGPTは計算も難なくこなした

ただし、論理クイズはまだ苦手です。試しに「明後日の3日前は月曜日、さて今日は何曜日？」と入力してみましょう。

プロンプト

明後日の3日前は月曜日、さて今日は何曜日？
出力

課題と施策、タイムスケジュールといった包括的な計画を生成した

o1-previewにプロンプトを入れたところ、きちんと回答してくれました。ChatGPT-4oでは最初誤答しましたが「ステップバイステップで考えてください」と指示を追加したところ、正解にたどり着きました。

GPT-4oは誤答した

以上が、推論するChatGPT o1-previewで計画立案や課題解決をするプロンプトとなります。いい感じの出力が得られることも多いのですが、プロンプトを細かくいじれないので、望む内容が得られないことも多々ありました。逆に、詳細なプロンプトを考えるのが面倒で、シンプルな指示を勝手に解釈して出力させたいときに役立つでしょう。