今回はGoogle Geminiを文書の要約に使う方法を取り上げる。文書の要約は生成AIの代表的な使い方のひとつであり、Google Geminiにおいても活躍することが多い使い方だ。この機能を使いこなすことでこれまでの作業効率を引き上げることができる。ただ注意点もあるので、今回はそうしたあたりを取り上げる。

連載「Google Geminiの活用方法」のこれまでの回はこちらを参照

日本語Webページの要約

今回は次のWebページの内容を要約することを考える。

  • 福沢諭吉 学問のすすめ

    福沢諭吉 学問のすすめ

Google Geminiに対して次のような指示を与える。

https://www.aozora.gr.jp/cards/000296/files/47061_29420.html の内容を要約してください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

上記スクリーンショットのように概要が生成されたことを確認できる。対象の文書の内容をざっと知っておきたい場合や、文書を読む前にある程度どういった内容なのか知っておきたい場合に便利な機能だ。

英語Webページの要約

Google Geminiがさらに便利なのは母国語以外のWebページの内容を理解する必要があるときなどだ。Google Geminiは日本語をはじめ世界中の言語に対応しており、内容を要約するように指示を出せば母国語以外のWebページであっても内容を要約して母国語で説明してくれる。

ここでは次のWebページについて考える。先日IBMからオープンソースとして公開された言語モデルGraniteに関する説明を行っているWebページだ。

  • IBM’s Granite code model family is going open source - IBM Research

    IBM’s Granite code model family is going open source - IBM Research

Google Geminiに次のような指示を与える。

https://research.ibm.com/blog/granite-code-models-open-source の内容を要約してください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

上記スクリーンショットのように英語のWebページの内容を要約して日本語で説明してくれていることが分かる。

Webブラウザー(Google Chrome、Microsoft Edge、Apple Safari)の機能を使えば英語のWebページを日本語で読むことはできるが、Google Geminiを使うとさらにその内容を要約して概要を読むことができるようになる。

PDFの要約

Google Geminiが便利なのは情報ソースとしてWebページだけではなくPDFなども直接指定できる点にある。例えば、次の文書について考える。

  • 「日本人の食事摂取基準(2025 年版)」策定検討会報告書(案) R6.3.6

    「日本人の食事摂取基準(2025 年版)」策定検討会報告書(案) R6.3.6

「日本人の食事摂取基準」は厚生省から5年おきに改訂版が公開されており、現在は来年の公開へ向けた改定作業が取り組まれている。この文書は日本人の食事を考える上で欠かすことのできない情報源だが、上記スクリーンショットからも分かるように500ページを超えており、全てを読むのは骨が折れる。

次のような指示を出すと、とりあえずその内容を要約してもらうことができる。

https://www.mhlw.go.jp/content/10904750/001219684.pdf の内容を要約してください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

何気なく動作しているように見えるが、PDFのURLを直接指定して動作してくれるというのはとても便利だ。公式文書の多くがPDFで公開されていることなどから、このようにPDFを扱ってくれると非常に助かる。

必要な情報だけをピンポイントで抽出する

Google Geminiが便利なのは概要を生成させるだけではなく、指定した文書に対して特定の情報を抽出することができる点にもある。かなりの量のドキュメントになってくると、概要の生成に加えて、こうした特定の情報を抽出する操作が重要になってくる。

例えば、次の文書を考えよう。先ほど取り上げた文書は現在策定段階にあるものなので、執筆時点での公式版と言える「日本人の食事摂取基準(2020 年版)」を取り上げる。494ページあり、なかなかに量が多い。

  • 日本人の食事摂取基準(2020 年版)「日本人の食事摂取基準」策定検討会報告書

    日本人の食事摂取基準(2020 年版)「日本人の食事摂取基準」策定検討会報告書

まず内容の要約を指示する。

https://www.mhlw.go.jp/content/10904750/000586553.pdf の内容を要約してください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

次に、「このPDFが」という明確な指定を行った上で、一価不飽和脂肪酸の健康効果について説明している内容をまとめるように指示を出す。

このPDFが一価不飽和脂肪酸の健康効果について認めている内容をまとめてください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

すると上記スクリーンショットのように、この文書は一価不飽和脂肪酸の健康効果は明確な記述を行っていないという返事が返ってくる。

この回答の根拠となるのは「日本人の食事摂取基準(2020 年版)」にある次の部分だ。

  • 元資料の対応する部分

    元資料の対応する部分

コホート研究の結果をまとめたメタアナリシスにおいて総死亡率、循環器疾患死亡率、脳卒中死亡率、心筋梗塞死亡率のどの指標でも優位な関連を観察していないと説明している。この部分の説明は多少入り組んでいるので間違った回答を出しやすいところだが、Geminiは比較的問題のない回答を行っている。

しかし、Google検索の内容を引用して、PDFには掲載されていない情報を回答した点については賛否が分かれる可能性がある。Geminiが追加で付与した情報はPDFではその点は触れておらず、Geminiの回答は誤解を招く可能性がある。

間違いも生成するので注意が必要

またGeminiは説明がかなり入り組んでいると不適切な回答を返すこともある。仮に、次のような指示を与える。

このPDFがビタミンDの摂取量について説明している内容をまとめてください。

  • Geminiの回答サンプル

    Geminiの回答サンプル

Geminiは1日あたり6.3マイクログラムと回答したが、この回答は間違っている。まず、PDFの該当部分は次のように説明している。

  • 元資料の対応する部分の一部

    元資料の対応する部分の一部

ここでの正解は8.5マイクログラムであり6.3マイクログラムではない。

この質問に対する回答はかなり難しい。まずこのPDFでは推奨量は提示することは難しいとして目安量を書いている。推奨量と目安量の違いについてはPDFの中で説明が行われているので、まずこの違いを取り込む必要がある。さらに目安量は乳児、小児、成人、高齢者、妊婦・授乳婦で分けて異なる箇所で説明されている。

正確に回答するなら推奨量と目安量の違いを説明し、乳児、小児、成人、高齢者、妊婦・授乳婦ごとの目安量を示し、さらになぜ推奨量ではなく目安量となっているのかを理由を説明する必要がある。無償で利用できるGoogle Geminiは今のところこのレベルの複雑な内容には適切に回答できないことが分かる。

まったく知らない文書に使うときは気を付けながら使おう

Google GeminiはGoogleアカウントがあれば使うことができる便利なサービスだが、入り組んだ日本語文書に対しては間違った内容を返すことがあることを知っておくべきだろう。

まったく中身を読んだことのない文書に対して質問を行うときは回答に嘘が紛れ込む可能性があることをよく理解しておこう。概要の生成はそれほど大きな間違いが紛れ込むことは少ないように思うが、個別に質問をすると嘘が混入することがある。

現実的な利用方法としては、ある程度内容を知っている文書について内容の確認や該当する箇所を知るためだけにGoogle Geminiを使うということになる。回答の真偽を知っている状態なら嘘をついているかどうかを見分けやすい。何も知らない状態で全面的に信用して使うのはリスクが高いと言えるだろう。

参考