カナコさんが解説! ChatGPT活用“はじめの一歩”(4) ChatGPTはもっともらしく嘘をつく

前回はChatGPTの強みと、効果的に活用する方法について解説しました。ChatGPTの強みは、ざっくり言うと次の2つです。

究極にパーソナライズされた応答を得られる
対話によって少しずつ欲しい応答に近づけていける

ChatGPTは、これらの強みをうまく活用することで非常に大きな効果を得られるツールです。

一方で、ChatGPTを活用する際には知っておいたほうが良い弱点も存在します。今回はそんなChatGPTの注意点について解説します。

本連載を1冊にまとめました!
【限定eBook】AI研究家がやさしく解説! ChatGPT活用“はじめの一歩”
＞＞ダウンロードはこちら

ChatGPTはもっともらしく嘘をつく

ChatGPTを使う上で最も注意しなければならない点であり、現在では広く知られた課題にもなっているのが「嘘をつく」問題です。「幻覚（ハルシネーション）」と呼ぶこともあります。

具体例を紹介しましょう。

ChatGPTに次のようなプロンプトを入力します。

「大西可奈子について教えて」

このプロンプトにChatGPTはどのように応答するでしょうか。次に示すのは、誤字を含め、ChatGPTが出力したままの文章です。

「大西可奈子（おおにしけなこ）は、私の知識のカットオフが2021年なので、それ以降の情報はわかりませんが、それまでの情報を元にお伝えします。

大西可奈子は、日本の女性声優で、アニメやゲームなどで声を担当することで知られています。以下は彼女に関する一般的な情報です。

生年月日：1980年11月26日
出身地：東京都

大西可奈子は、アニメやゲームのキャラクター役として幅広いジャンルで活躍しています。彼女の代表的な出演作品には以下のようなものがあります（2021年までの情報を含む）：『ラブライブ!』シリーズ - 東條希役（以下略）」

ChatGPTの知識が2021年までだという前置きはあるものの、大西可奈子は声優だという文章を生成してきました。もちろん私は声優ではないですし、また大西可奈子という声優は存在していません。私がWebで検索した結果なので100%存在しないのかというとわからないのですが、少なくともWeb上には情報として存在しないと思います。また、いずれにしても「『ラブライブ!』シリーズ - 東條希役」の声優は大西可奈子ではなく楠田亜衣奈さんです。

つまり、ChatGPTが生成したこの文章は真っ赤な「嘘」なのです。では、なぜChatGPTは存在しない人物について、まるで知っているかのような嘘をついたのでしょうか。

この「嘘つき」問題には、第2回で解説したChatGPTの仕組みが大きく関係しています。

ChatGPTがどのように文章を生成しているのかを思い出してみてください。

ChatGPTは「人の質問を理解して応答しているのではなく、人が入力した文章（プロンプト）の続きを予測して文章を生成している」のでしたね。つまり、ChatGPTは「生成した文章の正誤判定はしていない」のです。

先ほどの例で言えば、ChatGPTは単に「大西可奈子について教えて」という文章の続きとして、適切である可能性が高い文章を予測して生成しただけなのです。

私自身に関する情報もWebには存在していますから学習自体はしているかもしれませんが、それよりも「大西可奈子」という人物について、他人の情報を用いてそれっぽく生成してしまう方がChatGPTにとっては好ましかったというわけです。ChatGPTの仕事は「それらしい続きを生成する」ことであり、大西可奈子という声優が実在するかどうかはどうでもいいのです。これこそがChatGPTの「幻覚」問題です。

ChatGPTの仕組み上、この幻覚問題を解決するのは簡単ではありません。

では、どうすればいいのか。

重要なのは、ChatGPTの答えが正しいか誤っているかを人の目で見分けられることです。例えば、前回の活用法で紹介した「謝罪メールのひな型」をChatGPTに作成させるのは問題ありません。なぜなら、メールの内容に誤りや不適切な部分があっても、送信する前に人の目で確認して修正できるからです。

逆にやってはいけないのは、ChatGPTが生成したメールをそのまま自動で返信してしまうことです。ChatGPTが生成した文章を自分以外にアウトプットする場合は、必ず人の目によるチェックを入れるようにしましょう。これは、知らず知らず著作権侵害をしないためにも大事なことです。ChatGPTは基本的に参照元のURLなどを公開しないので、生成した文章がどこかのWebサイトの文章そのままという可能性もゼロではないからです。

ChatGPTを使う上でのその他の注意点

この他にも、ChatGPTを活用する際にはいくつか注意しておくべき点があります。

まず、ChatGPTは最新の情報には対応していないということです。現行のChatGPTは2021年9月までのデータを学習していると言われており、それ以降の情報については回答できません。例えば「今年の大河ドラマは？」という質問には「2023年の大河ドラマについての情報は、公式な情報源やニュースをご確認いただくか、他の情報源を利用していただくことをおすすめします。」といった答えを返してきます。

一応、有料版のChatGPT Plusユーザー向けに提供開始されたWebブラウジング機能を利用すれば回答可能になるケースもありますし、今後はデータが更新される可能性もあります。これはあくまでも本稿執筆時点（2023年9月）での話と考えておいてください。

また、ChatGPTはそもそもWebでオープンになっている情報以外は回答できません。ChatGPTの学習データはWeb上にある情報だけですから、これは当然ですよね。まだ世の中に出ていない情報や、プライベートな情報については回答できないのです。

なお、この問題についてはプロンプトを工夫したり、APIを利用してモデル自体をチューニングしたりする方法で解決できる可能性があります。ただし、その方法はやや難しいので、ここでは触れません。

同じ入力に対して応答が変化する点にも注意が必要です。第2回でも解説した通り、ChatGPTは入力された文章の続きになり得る単語を確率で生成しているため、ランダム性もあります。そのため、まったく同じプロンプトであったとしても、毎回同じ応答になるとは限らないのです。

これ自体は必ずしも弱点というわけではなく、ある意味ChatGPTの「人らしさ」を演出しているとも言えます。話し相手としてChatGPTを活用する分には、楽しい要素です。

ただし、チャットボットとしてFAQ的に使用する場合などは注意が必要です。例えば、オンラインショップのチャットボットがユーザーからの質問に毎回違う答えを返していたら、問題があるでしょう。そもそもオンラインショップのように、事前にある程度質問が想定できるケースではChatGPTではなく、ルールベースか従来のAIの仕組みを用いるべきですが……。

最後に、ChatGPTに入力したプロンプトは、ChatGPTの学習に活用される可能性があることも覚えておきましょう。極端な話、あなたが入力したプロンプトの内容が、他の誰かのChatGPTの回答に使われる可能性があるということです。

そのため、会社の機密情報などをプロンプトに入力してしまうと、場合によっては取り返しのつかない情報流出につながるリスクもあります。このリスクを回避するためにはAPIを活用するなどいくつか方法がありますが、ここでは割愛します。

今回は、ChatGPTを活用する上での注意点について解説しました。リスクを聞いて、ChatGPTの活用をためらってしまう人がいるかもしれませんが、正しい知識を持ってさえいれば、こんなにも便利なツールはありません。注意点を踏まえた上で、どんどん活用していきましょう。

次回は最終回として、今後の社会がChatGPTでどう変わっていくのかについて考察していきます。