OpenAIは2024年5月13日(米国時間)に新しいフラッグシップモデル「GPT-4o」を発表した。このモデルは前モデルGPT-4よりも賢く、動作速度も向上している。マルチモーダル機能が改善され、リアルタイム音声会話やリアルタイム翻訳も可能となるとされている。Microsoftは同日、Azure OpenAI ServiceでGPT-4oのプレビュー提供を発表した。今回はGPT-4oがCopilot in Windowsのような多くのユーザーが利用する機能にどのタイミングで導入されるのかといった情報に関して取りまとめる。
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
OpenAIのフラッグシップモデル「GPT-4o」
OpenAIは2024年5月13日(米国時間)、同社の新しいフラッグシップモデル「GPT-4o」を発表した。この最新モデルは最初に有償版であるChatGPT PlusおよびChatGPT Teamのユーザーへ提供され、次にEnterpriseユーザーへ提供される。また、利用制限付きながらも無償版にも提供が行われるとされている(参考「Introducing GPT-4o and more tools to ChatGPT free users | OpenAI」)。
ChatGPT PlusやChatGPT Teamのユーザーはすでに体感していることだと思うが、GPT-4oはひとつ前のフラッグシップモデルである「GPT-4」よりも賢い。GPT-4では適切に回答することができなかった質問に適切に回答できるようになり、動作速度も向上している。
GPT-4はマルチモーダルモデルになっており、テキストのみならず画像や音声なども統合して利用できるようになった。GPT-4oはこのマルチモーダル機能がさらに改善されており、GPT-4よりも高速でかつ高性能に動作するという特徴がある(参考「Introducing GPT-4o - YouTube」)。
GPT-4oは今後リアルタイム音声会話、リアルタイム翻訳、リアルタイムビデオ鑑賞およびやりとりなどが可能になることも説明されており、マルチモーダル対応の大規模言語モデル(LLM: Large Language Model)として次のレベルに到達したことを示している。
MicrosoftもGPT-4oのプレビュー提供を開始、ただしAzureで
OpenAIに多額の出資を行い同社の技術を利用しやすい立場にあるMicrosoftがどのタイミングで同社のサービスにGPT-4oを取り込むのかが注目される。MicrosoftはCopilot in WindowsにOpenAIのDALL・E 3を統合するなどOpenAIの技術を積極的に取り込んでおり、GPT-4oについても何らかのかたちで導入するのではないかと推測される。
Microsoftは2024年5月13日(米国時間)、OpenAIの発表に合わせるように「Azure OpenAI Service」においてGPT-4oをサポートすると発表した。発表時点ですでにプレビュー版として利用可能になっていることが説明されている(参考「Introducing GPT-4o: OpenAI’s new flagship multimodal model now in preview on Azure | Microsoft Azure Blog」)
-
Introducing GPT-4o: OpenAI’s new flagship multimodal model now in preview on Azure | Microsoft Azure Blog
Azure OpenAI ServiceはOpenAIのAIモデルをMicrosoft Azure上で利用可能にするサービスだ。このサービスを使うことで企業や開発者はGPT-3、GPT-4、GPT-4oなどの言語モデルを使ってテキスト生成、自然言語理解、会話型AI、データ解析などの用途に対応するソリューションを開発することができる。スケーラブルなAzureのクラウドインフラを利用でき、かつ、OpenAIの強力な言語モデルを利用することができるサービスである。
発表時点でプレビュー版は米国の2つのリージョンで提供されており、Azure OpenAI Studioのプレビュープレーグラウンドを通じての試用が可能になっている。この段階ではテキストおよび画像に関する機能に焦点が当てられており、音声および動画については今後の機能提供になることが説明されている。
Copilot+ PCでGPT-4oの提供すると発表
多くのWindowsユーザーにとって最も使用する機会が多いのはWindowsに標準搭載されている「Copilot in Windows」と、WebブラウザとしてMicrosoft Edgeを使っている場合にEdgeに統合されているCopilotだ。これらCopilotでGPT-4oがいつから使えるようになるのかが、ユーザーにとって大きな関心事ということになる。
この点に関してMicrosoftはまだ何も公式な発表を行っていない。すでにいくつかのメディアはMicrosoftがCopilot in WindowsやEdgeのCopilotでGPT-4oの使用を開始している可能性があるとの指摘を行っているが、確固たる根拠は示されていないのが現状だ。
明示されているわけではないものの、Microsoftが公式に発表している情報のうち「Copilot+ PC」について発表した「Introducing Copilot+ PCs - The Official Microsoft Blog」が示唆的な内容を伝えている。この発表はAI機能の活用を目的として設計された新しいWindows PCのカテゴリーであるCopilot+ PCについて説明したものだが、その説明に次のような内容が含まれている。
Every Copilot+ PC comes with your personal powerful AI agent that is just a single tap away on keyboards with the new Copilot key. Copilot will now have the full application experience customers have been asking for in a streamlined, simple yet powerful and personal design. Copilot puts the most advanced AI models at your fingertips. In the coming weeks, get access to the latest models including GPT-4o from our partners at OpenAI, so you can have voice conversations that feel more natural.
(訳: すべてのCopilot+ PCには、新しいCopilotキーを備えたキーボードで、ワンタップでアクセスできる個人的で強力なAIエージェントが搭載されている。Copilotは、顧客が求めていたフルアプリケーションエクスペリエンスを、洗練されシンプルでありながら強力かつ個人的なデザインで提供する。Copilotは、最先端のAIモデルを手元に提供するものだ。今後数週間で、OpenAIのパートナーから提供される最新モデルGPT-4oを含むモデルにアクセスできるようになり、より自然な音声会話が可能となる)
具体的にどのソフトウエアがGPT-4oを含むモデルにアクセスできるようになるのかは言及されていないが、これまでのMicrosoftの動向を考えると、Copilot in Windowsにリアルタイム音声通話の機能を統合した状態でGPT-4oが提供される可能性が考えられる。少なくとも何らかのかたちでGPT-4oが利用可能になることは間違いないように思える。
なお、公開されている説明からはGPT-4oの利用をCopilot+ PCに限定すると読めないこともないが、OpenAIが無償版でのGPT-4oの提供を発表していることを考えると、Copilot+ PCに限定する可能性はそれほど高くないと予測される。
モデルの変更は業務改善そのもの
生成AIがもたらす時間効果はきわめて高い。しかしこれは生成AIが適切な返答をするというケースに限られる。生成AIが問題に答えることができないケースや、生成AIが嘘をつく場合にはこの改善効果は期待できない。生成AIの回答を自分でチェックする必要が生まれるため、自ら業務に取り組む場合と大差がなくなってしまうためだ。
大規模言語モデル(LLM)のアップデートはこの状況に改善をもたらす。これまでのモデルのアップデートで生成AIは賢くなっている。従来のモデルでは答えられなかった問題に回答できるようになったり、不適切な回答をしていた部分が正確な回答をするようになっていたりと、改善が実現されているのだ。これはつまり、言語モデルのアップデートがそのまま業務改善に直結することを意味している。
OpenAIによるGPT-4oの発表はまさにそれだった。GPT-4が答えることができなかった問題や不適切な回答をしていたものも、GPT-4oは適切に回答できるようになるなど賢さの向上を見せている。このモデルがいつWindowsで使えるようになるかは、Windowsユーザーにとっても高い関心事だ。
OpenAIはGPT-4oを無償のユーザーに対しても提供していくことを発表しており、Microsoftもすでに限られたサービスでGPT-4o対応を謳っている。Copilot in WindowsやEdgeのCopilotでGPT-4oが使えるようになるのもそれほど遠い先の話ではないだろう。Microsoftの今後の対応に注目しておきたい。
付録: ショートカットキー
ショートカットキー | 内容 |
---|---|
「Windows」+「C」 | Copilot in Windowsの表示・非表示を切り替え |
付録: 対応バージョン
OS | バージョン |
---|---|
Windows 11 | Windows 11, version 22H2以降 |
Windows 10 | Windows 10, version 22H2以降のProおよびHome |
参考
- Copilot in Windows & Other AI-Powered Features | Microsoft
- Copilot documentation | Microsoft Learn
- Adopt, extend and build Copilot experiences across the Microsoft Cloud | Microsoft Learn
- Bringing the power of AI to Windows 11 - unlocking a new era of productivity for customers and developers with Windows Copilot and Dev Home - Windows Developer Blog