Microsoft Copilotアプリには「GPT-4を使用する」というオプションが表示されている。基本的にはこのオプションは有効にしておいた方がよい。今回は、GPTおよびGPT-4とは何か、機能を有効にすることでどのような違いが出るのかについて説明する。
生成AI関連の連載
ゼロから始めるMicrosoft Copilotアプリ
カナコさんが解説! ChatGPT活用“はじめの一歩”
ChatGPT入門 - 初めてのAIチャット活用
Copilot in Windowsを使ってみよう
画像生成の未来を体験しよう! DALL-E 3の世界
ExcelでChatGPTを使う - ChatGPT for Excel活用術
Microsoft Copilotアプリの「GPT-4を使用する」
Microsoft Copilotアプリの最初のページには、次のように「GPT-4を使用する」というオプションが表示されている。現状では、このオプションはデフォルトで無効になっている。タップすれば「有効」に切り替えられる。
そう遠くない時期にデフォルトでこの機能は有効になり、さらに先の将来は次のバージョンのGPTがデフォルトになっていくと考えられるが、現状ではGPT-4が利用できる最新版だ。基本的には有効にしておこう。
GPTって何?
GPTとは、「Generative Pre-trained Transformer」と呼ばれる大規模言語モデル(LLM: Large Language Model)を指している。自然言語処理に使われるニューラルネットワークであり、深層学習モデルの一つだ。他のモデルと比較して、GPTには次のような特徴があると言われている(参考「Generative pre-trained transformer - Wikipedia」)。
- 言語生成能力に長けている。自然で流暢な文章を生成することが可能で、対話の実現、文章の続きの生成、クリエーティブな文章の作成などをこなすことができる
- トランスフォーマーと呼ばれるニューラルネットワーク構造を採用している。このアーキテクチャは大量のテキストデータから文脈を理解するのに効果的と評価されている
- GPTモデルでは事前に大規模なテキストコーパスでトレーニングを行い、次に特定のタスクに適合するように微調整が行われる。こうした構造によってさまざまな言語タスクに対応できる
このモデルはOpenAIが2018年に導入したものが最初と考えられており、それ以降、GPT-1、GPT-2、GPT-3、GPT-4といった具合に基盤モデルがリリースされている。ChatGPTはOpenAIによって開発されたGPTに基づいて機能している。Microsoft CopilotのベースもGPTだ。
これまでのGPTの進化をざっとまとめると、次のようになる。
- GPT-1:最初のモデル。基本的なテキストの生成能力を有している
- GPT-2:より大きなデータセットでトレーニングされたモデル。より洗練された文章の生成が可能
- GPT-3:さらに大きなデータセットとパラメーターでトレーニングされたモデル。さらに高度な言語理解と生成能力を備えている
- GPT-4:本稿執筆時点における最新バージョン。これまでよりもさらに進化した理解力と生成力を持ち、より複雑なタスクや言語理解が可能。マルチモーダルに対応しており、画像とテキストのやり取りが可能
GPTには上記以外にもモデルがあるが、基本的には上記のバージョンを主軸として特定の用途に特化したものやマイナーアップデートされたものなどが存在している。
GPT-3とGPT-4でどれほど違うか
基本的には、GPT-3よりもGPT-4の方が賢い。GPT-4を使用すると、無効になっているときと比べて次のような違いがあると言われている。
- より複雑な質問やタスクに対しても適切に回答できる
- より長い文脈を保持可能なため、会話や文章における前後の関係を理解してそれに基づく回答が行える。複雑で長い会話や、長い文書などにおいて有利になる。GPT-4を無効にしてあると、長い会話や長い文書で一貫性のある回答が難しくなる可能性がある
- より広範囲のデータセットでトレーニングされているため、専門的な質問やニッチな質問に対しても有効な回答をする可能性がある
GPT-3とGPT-4の性能比較で取り上げられるサンプルとして、複雑な論理推論を必要とする質問を与え、それに対して正解を導くことができるか見るものがある。統計的にGPT-3よりもGPT-4の方が正解率が高いことが示されている。しかしながら、そのレベルになってくると、そもそも回答が正解なのかどうかを人間が別の手段で確認する必要が出てくるだろうから、どれだけ有効に使えるのかはケースバイケースになってくる。
少なくともGPT-4の方がGPT-3よりもだいたい賢い、と覚えておけばよいと思う。GPT-3が正しくてGPT-4が間違えることもあるしパーフェクトではないが、十分に有益なツールであることは間違いない。
GPT-4を有効にした場合、GPT-4を無効にしていあるときよりも回答が表示されるまでに時間がかかる。しかし、そもそもMicrosoft Copilotアプリを使って質問をする状況は、数秒の待ち時間が発生しても正解を知りたいというケースが多いと思うので、それほど問題にはならない待ち時間ではないだろう。