Google Geminiの使い方は簡単だ。Google GeminiのWebページにアクセスして、Googleアカウントでログインすれば良い。あとは知りたいことについてプロンプトから指示を出せば回答を得ることができる。このあたりの使い方はChatGPTもCopilotもほとんど違いがない。まずはアクセスしてGeminiを体験してみよう。

連載「Google Geminiの活用方法」のこれまでの回はこちらを参照

Google Geminiの使い方

Google Geminiの使い方は簡単だ。まず、Webブラウザーから「Gemini」にアクセスする。

  • Google Gemini

    Google Gemini

Google Geminiを利用するにはGoogleアカウントでログインする必要がある。Webページの右上に「ログイン」ボタンがあるので、このボタンをクリックしてログインする。

  • 右上の「ログイン」からGoogleアカウントでログインする

    右上の「ログイン」からGoogleアカウントでログインする

Googleアカウントを持っていない場合には「Google アカウントの作成 - Google アカウント ヘルプ」からアカウントを作成してから前述した作業を行う。

ログインすると次のようなWebページが表示される。このWebページの下部のテキスト入力フィールドがプロンプトだ。ここにテキスト、音声、画像で質問を行うことで利用する。

  • Google Geminiの基本画面

    Google Geminiの基本画面

Geminiとの会話は話題ごとにスレッドとしてまとめられる。スレッドは上記Webページの左側にリストとしてまとめられている。スレッドは名前を変更することや削除することができる。

Geminiの基本的な使い方はシンプルだ。Geminiの使い方はプロンプトでどのような質問をするか、および、どのような一連の質問をするかにかかっている。UIはシンプルであり、欲しい情報を得るためにどのような質問をすれば良いかを学んでいくのがGeminiを使いこなすことにつながる。

会話のやり取りで情報を深堀りする

Google Geminiのような反応の生成AIチャットは1回の質問に答えるだけではなく、質問、回答、質問、回答……といった具合に質問を繰り返していくことでより関連性の高い回答を得やすくなる仕組みになっている。例えば次のスクリーンショットは質問→回答→質問→回答→質問→回答といった具合に回答を得てからより情報を深堀りするような使い方をしている。

  • 質問1「トレーニング前にシトルリンやアルギニンを摂取することでより高いトレーニングを実現できると言われていますが、その理由を教えてください」

    質問1「トレーニング前にシトルリンやアルギニンを摂取することでより高いトレーニングを実現できると言われていますが、その理由を教えてください」

  • 質問2「筋トレなどで生成された乳酸は筋肉合成に関与しますか?」

    質問2「筋トレなどで生成された乳酸は筋肉合成に関与しますか?」

  • 質問3「先ほどの説明では、筋トレあとにシトルリンやアルギニンを摂取した場合には乳酸の分解が促進されることになると思います。これは乳酸を起点とする筋肥大にとっては逆効果であり、筋トレあとにはシトルリンやアルギニンをは摂取しない方がよいでしょうか?」

    質問3「先ほどの説明では、筋トレあとにシトルリンやアルギニンを摂取した場合には乳酸の分解が促進されることになると思います。これは乳酸を起点とする筋肥大にとっては逆効果であり、筋トレあとにはシトルリンやアルギニンをは摂取しない方がよいでしょうか?」

単一の質問ではなく一連の質問でより適切な回答を得るというアプローチはこれまでのグーグル検索ベースの調査方法とはアプローチが異なっているので最初は慣れないかもしれない。自分が調べたいことや知りたいことなどをモチーフにして何度も対話しながら慣れてみよう。

なお、生成AIはその構造上同じ質問であっても常に同じ文字列で返答してくるとは限らない。目的とする情報が得られない場合には、同じ質問を繰り返したり、質問内容を少し変えたりしてGeminiから別の角度での回答を引き出す工夫をしていく必要がある。

Google Geminiは発展途上

Google Gemini (旧 Google Bard)は今まさに発展途上にある。Googleは「Gemini アプリの機能アップデート」においてGoogle Bardを発表してからの機能追加などを伝えている。注目しておきたい変更点に絞ってまとめると、次のようになり、この1年間で急ピッチの発展を遂げていることが分かるだろう。

2023年4月21日:対応プログラミング言語追加

20を超えるプログラミング言語のコーディングに対応。Google Bardが生成したPythonコードをGoogle Colabに直接エクスポートしてテストすることにも対応。C++、Go、Java、JavaScript、Python、TypeScript、Googleスプレッドシート関数などの言語でのサポートをBardにリクエスト可能。

2023年5月5日:WorkspaceでBard有効化

Google Workspace管理者がドメインごとにGoogle Bardを有効にできるように対応。各ドメインのユーザーがWorkspaceアカウントでBardにアクセスできるようになる。管理者がBardを有効に設定したGoogle Workspaceアカウントでログインすることで、仕事、研究、その他のビジネスニーズにBardを活用できる。

2023年5月10日:日本語対応

英語(米国)に加え、日本語と韓国語のGoogle Bard利用に対応。英語(米国)、日本語、韓国語の3言語で180を超える国や地域においてBardを利用可能。Bardを利用できる言語、国、地域は、時間をかけて拡大予定。

Bardが生成したコンテンツを書式も含めてワンクリックでGoogleドキュメントやGmailにエクスポートできるように対応。Bardの回答をエクスポートし、これらのGoogle Workspaceアプリで直接編集できるようにすることでワークフローの迅速化と簡素化が可能。

2023年5月15日:要約機能改善

大規模言語モデルでの開発における進展を反映し要約機能を向上。この機能改善によってトピックの要点をすばやく確認することができる。

2023年5月23日:画像での回答に対応(英語版のみ)

英語での回答についてGoogle BardがGoogle検索から画像を表示できるように変更。Bardに直接画像をリクエストすることも可能。画像を使用することでアイデアをより効果的に伝えることができるほか、コンセプトの具体化や説得力のある提案などが可能になり、視覚情報が必要なときにより適切な回答が得られる。

2023年6月1日:位置情報による関連性向上

デバイスの正確な位置情報の使用をGoogle Bardに許可するとより関連性の高い回答が表示されるように変更。正確な位置情報によりBardは現在地周辺のレストランやお住まいの地域のさまざまな情報に関して、より関連性の高い回答を提供することができる。

2023年6月7日:コード実行対応(英語版のみ)

計算に関するプロンプトを検出しバックグラウンドでコードを実行するようにGoogle Bardを変更(英語版のみ)。数学的なタスク、コーディングに関する質問への回答、文字列の操作をより適切に行えるように変更。特定の数字がデータセットに表示される回数を検出するなど、Bardの計算能力を強化することにより高度なデータ分析に対応。

2023年7月13日:40以上の言語に対応、スレッド対応、共有機能、画像入力対応(英語版のみ)

アラビア語、中国語(簡体字、繁体字)、ドイツ語、ヒンディー語、スペイン語など、40以上の言語に対応したほか、欧州連合(27か国)およびブラジルなど利用対象地域を拡大。ヒンディー語、スペイン語、英語(米国)など40を超える言語でテキスト読み上げ機能に対テキスト読み上げ機能に対応。

Bardとの以前の会話を中断したところから再開しニーズに応じて整理できるようにスレッド機能を導入。会話を固定したり会話の名前を変更したり一度に複数の会話を進めたりする機能に対応。アイデアを得るまでには数時間または数日かかることがある。そのため、スレッドを維持し、最も重要なスレッドを固定してクリエイティブなプロセスを続けることができるように変更。また、Bardとのチャットの一部または全てを他のユーザーと簡単に共有できるように変更。

Google Bardへの画像アップロードに対応(英語版に対してGoogleレンズを導入)。画像に関する情報がもっと必要なとき、写真に面白いキャプションをつけたいときなど、Bardでの探求や制作のための新しい手段として利用できる。

2023年9月19日:Googleで検索v2

[G]ボタンを使用することでGoogle検索を利用してGoogle BardのAI生成された回答を再確認することが可能(英語版のみ)。記述を評価できる場合にBardの回答内でハイライト表示された場所をクリックすると詳細を確認可能。

全ての対応言語でGoogleレンズでの画像のアップロードおよびGoogle画像検索結果を使った回答、回答の書き換え(シンプルにする、長くする、短くする、専門的な表現にする、カジュアルな表現にする)に対応。

2023年9月27日:2つの回答案表示導入

フィードバックを送信する新しい方法を追加。回答の際、Google Bardが2つの回答案を並べて表示することができるように変更。こうした場合にどちらか好きな回答案を選択することが可能。選択せずに進むこともでき、この機能を完全にオフにすることも可能。実際に利用したユーザーからのフィードバックはBardの回答の品質向上に役立る。Bardの回答案に関するフィードバックはBardの改善に使われる。

2023年10月30日:リアルタイム表示

Google Bardの回答を生成中に表示できる新しい設定を公開。これにより、完全な回答が生成されるまで待つ必要がなくなる。Bardの目的はクリエイティブなプロセスを効率化することであり、生成途中でも回答を読み始められるためクリエイティブな思考を止めることなくアイデアをよりすばやくかたちにできる。

2023年11月16日:対象年齢拡大(英語版のみ)

世界中のほとんどの国で13歳以上のユーザーがGoogle Bardを利用できるように変更(英語版のみ)。年齢に適した保護機能の追加、13歳以上向けのオンボーディングプロセスの更新、Bardでの探求と学習を支援する機能の開発を実施。

2023年12月18日:拡張機能の日本語対応

英語に加え日本語と韓国語でもGoogle Bardを使ってGoogleのアプリやサービスの有用な情報にアクセスできるように変更。Bard拡張機能を使用するとYouTube、Googleホテル、Googleフライト、Googleマップからリアルタイムの情報を取得可能。また、Gmail、Googleドキュメント、Googleドライブから情報を取得して、個人のコンテンツから検索を行ったり、概要を作成したり、回答を得たりすることも可能。

[Replitにエクスポート]機能でPythonに加えて、C++、JavaScript、Ruby、SQL、Swiftを含む18のプログラミング言語に対応。

2024年2月1日:Gemini Pro搭載Bard

Google Bardを利用できる全ての言語に対してGemini Pro搭載Bardの利用に対応。このアップグレードにより理解、要約、推論、記述、ブレインストーミング、プランニングなどをより効率的に行えるようになる。

Bardの回答のダブルチェック機能がほとんどの対応言語に拡大。

2024年2月8日:Google Geminiへリブランド、Gemini Advanced有償プラン登場

Google Bardの名称を「Google Gemini」へ変更。

Googleの高性能なAIモデル「1.0 Ultra」に対応した「Gemini Advanced」を発表。Gemini Advancedは150以上の国と地域に対応した有償プラン。コーディング、論理的推論、細かい指示への対応、クリエイティブなコラボレーションなど複雑なタスクをより効率的に行うことが可能。今後数か月間にわたって新機能や限定機能を継続的に追加予定。マルチモーダル機能の拡張、コーディング機能のさらなる強化、ファイル、ドキュメント、データをアップロードしてより深く分析する機能などの追加を予定している。

AndroidでGeminiアプリを提供開始(英語版のみ、一部のデバイスに対してリリース予定)。iOSデバイスの場合はGoogle アプリから使用可能。日本語、韓国語、その他の英語対応は近日中にサポート予定。

2024年2月20日:Pythonコード編集機能(Gemini Advancedのみ)

PythonコードのスニペットをGeminiのユーザーインターフェイス内で直接編集して実行できるように変更(Gemini Advancedのみ)。コードをテストし、その変更が出力にどう影響するかを確認、コードが想定どおり動作するかどうかを検証することが可能。

有償版にも注目

Googleのここ数か月の動きを見ると、魅力的な機能はまず有償版のGoogle Advancedに導入するといった動きを見せている。無償で使えるGoogle Geminiに新機能を取り込むペースはやや緩やかになる可能性がある。

この動向は他社の動きに関連しているものと見られる。無償で使える汎用生成AIチャットはOpenAIのChatGPTとMicrosoftのCopilotが代表的な存在だ。これら無償サービスに新機能が導入されると、そこにユーザーを取られないように類似の機能を開放していくといったスタイルになっていくようだ。これはChatGPTやCopilotも同様である。相互に様子を見ながらどこまで有償機能を無償版にリリースするかを判断しているようだ。

無償版の生成AIを使って業務に効果性の改善があると判断した場合には有償版の利用を検討したい。生成AIは業務によってはかなりの効果をもたらす。無償版と有償版は性能にそれなりに差があるので、無償版で高い効果を感じたり設けられている制限に不便さを感じているのであれば有償版も検討してみるのも良いだろう。利用する価値があるかどうかはケース・バイ・ケースだが、高い可能性を秘めていることは間違いないところだ。

参考