「世界で初めて、生成AIによって作成された文章に電子透かしを2重、3重と多重に入れられる技術を開発した。これによってほぼ100%の確率で文章の生成元を見抜くことができ、フェイクニュースなど生成AI悪用への対策につながる」ーー。
7月29日、報道関係者による合同取材に応じた日立製作所(日立) 研究開発グループ 先端AIイノベーションセンタの永塚光一氏は、新技術のインパクトをこう強調した。「AI研究者界隈でもあまり知られていない技術」(永塚氏)という「多重電子透かし」はいったいどのような技術なのだろうか。生成AIをめぐる昨今の社会課題とともに説明しよう。
拡散するフェイクニュース、生成AIの「負の側面」
世界的に選挙イヤーでもある2024年。生成AIが普及する中、フェイクニュースなどの負の側面が身近となってきている。現在行われている米国大統領選でも、生成AIによる偽情報拡散が問題化している。
選挙妨害だけでなく、著名人の偽動画によるなりすましや、学生による試験やレポートで生成AIを不正に利用するといった事例も多い。そのため、コンテンツの生成元がAIかを判別する技術の重要性が増している。
そのような状況の中、欧州連合(EU)では世界に先駆けて包括的に生成AIに対する法規制を5月に設立した。AI事業者に対し、生成AIが作成したコンテンツを明示及び検出できる技術の導入を要求している。また、米国では生成AI規制のための大統領令が施行されており、AI開発者に対し、AIが生成した画像や音声の「ディープフェイク」を判別する「電子透かし」を義務付ける方針だ。
「誰もが生成AIを安全・安心に利用できるようにするための技術開発が加速している。その第一歩が『情報の生成元を判別する』技術だ」(永塚氏)
電子透かしとは?
では、電子透かしとはいったいどのような技術なのだろうか。
「透かし」は、偽造や改ざんから守る技術として17世紀以降、紙幣や切手、法的文書などで活用されてきた。例えば、7月3日に20年ぶりに新しくなった紙幣では偽造対策が強化されている。1つの透かしが偽造可能になってしまった時のために、紙幣には日本銀行しか知らない「複数」の透かしが入れられており、これによって紙幣の価値が担保されている。
そして、デジタルコンテンツに透かしを入れる技術が電子透かしだ。インターネットの普及とともに、著作権保護や品質保証といった観点から、デジタルコンテンツに作成者の情報を埋め込む技術が登場し、画像や音声、動画などへの導入が広まった。
電子透かしには目に見えるものと見えないものの2種類がある。ストックフォトの購入前の画像のように、ロゴやテキストなど目立つパターンを埋め込むことで不正な利用を抑止する「可視型」と、コンテンツの外観の質は損なわず、パスワードのような鍵を利用したり特殊な分析技術などを利用したりして検出する「非可視型」の2種類だ。
永塚氏は「可視型は『勝手に使用しないで』という著作権保護の意味で使われ、非可視型は『使ってもいいけど、後できちんと検出できるようにするよ』というコンテンツの追跡の意味で使われる」と説明した。
ハードルが高い「文章への電子透かし」
電子透かしの導入は画像や動画で先行しており、すでに実用的な電子透かしがサービスの機能として搭載されている。
例えば、中国発の動画共有アプリ「TikTok」の運営会社である字節跳動(バイトダンス)は、2023年9月に同社独自の特殊効果を使用して作成されたAI生成コンテンツへのラベル付け機能を実装した。さらに2024年5月には、他のプラットフォームで作成された生成AIを使ったコンテンツにも自動的にラベルを付けると発表。
また非可視型の例としては、米Google傘下のDeepMindは2023年8月にAI由来のデジタルコンテンツに電子透かしを埋め込むツール「Synth ID」を発表。画像や音声、動画などさまざまなメディアに見えない透かしを導入している。
ビックテックを筆頭に電子透かしの導入が進んでいる一方で、「文章への電子透かしはハードルが高く、導入が遅れている」と永塚氏は指摘する。文字の持つ特性上、文章への透かしは簡単に改ざんされてしまう恐れがあるという。
画像や動画の透かしの場合、色と位置を決める最小単位「ピクセル」を1つ変えてもコンテンツへの影響が少ないが、文章は文字を1つでも変えると意味が変わってしまう。冗長性の低さから、文章そのものに透かしを入れることは困難とされてきたという。
こうした流れを変えたのは、米メリーランド大学に所属する研究者らが2023年に発表した1つの論文だ。
「特定の単語の割合が高い」=「生成AIが作った文章」
メリーランド大学の研究者が発表した文章への電子透かしの仕組みはこうだ。
大規模言語モデル(LLM)によって実現する生成AIは、特定の言葉に続く確率が高いと考えられる言葉を並べることで文章を生成しているが、この際にAIが「特定の単語」を自動的に選ぶように細工する。
具体的には、1つ前の単語から予測されるすべての単語を緑のグループ(透かし対象)と灰色のグループ(透かし対象外)に分け、生成AIは文章を生成しながらリアルタイムで特定の単語のワードリストを自動生成し、書き出す文章に反映する。
つまり、高い割合で特定の単語が文章に採用されている状態であれば、その文章はAIが生成した確率が高いということになる。緑のグループの単語の割合が圧倒的に多い文章は確率的に「透かしあり」で、生成AIが書いたと判断できる。人間が書いた文章の場合は、灰色と緑のグループの単語が半々くらいになるからだ。
どの言葉が特定の単語なのかは、パスワードのような鍵を使用しないと検出できない仕組みだ。また、この鍵がなければ、透かしを作成することもできない。
日立が開発した世界初の技術「多重電子透かし」
しかし、もしこの鍵がハッカーなど悪意のある人間の攻撃によって漏洩してしまうと、不特定多数の人物が透かしを再現できるようになり、生成元の判別が不可能になってしまう。紙幣の場合で考えると、日本銀行しか知らない透かしが外部に漏れてしまえば、流通しているすべての紙幣について真偽を判断できなくなるだろう。
そこで、日立は世界初だという生成AIによって作成された文章に電子透かしを2重、3重と多重に入れられる技術を開発した。2重透かしの技術としても日本初だという。
透かしを「2重で入れる」とはどういうことだろうか。永塚氏はこう説明した。
「透かしの対象となる緑のワードリストの中から特に選ばれやすい『濃い緑』のワードを選定し、それを文章に反映させる。これが2重目の透かしとなり、1つ目の透かしの鍵が漏洩して透かしが偽造されても、2つ目の透かしで生成元を判別できるようになる」
ロジックはメリーランド大学の研究者が開発した技術と同じだが、それを多重で入れられるようにした。多重透かしでより堅牢にすることで、高い精度で生成元を判別できるようになるという。永塚氏によると、98.8%以上の精度で第2透かしを検出できるという。
しかし、この“多重"には上限がある。この透かし技術の精度は文章の長さに依存するからだ。統計的に判断しているため、文章が長くなればなるほど、つまり単語数が増えれば増えるほど透かしの精度は高まる。
「多重に透かしを入れるということは、単語のグループ分けを多重に行いどんどん細分化を行うということ。2重でも十分な精度を出すことができるため、現状の上限は3~4重だと考えている。小説といった長い文章であれば、3重以上の透かしは実用的だろう」と永塚氏は予測する。
この堅牢な文章への電子透かしが普及することで、フェイクニュースと疑われる報道やSNS投稿について、誰でも生成元を確認できるようになるだろう。テキストを貼り付けるだけで翻訳してくれるアプリのように、疑わしい文章を読み込ませるだけで「これは生成AIによって作られた記事です」と教えてくれるアプリが誕生するかもしれない。
また、報道機関といった書き手の観点でも、この技術は自社の記事が生成AIによって書かれたものかどうかを掲載前にチェックするツールとして使用できる。生成AIを使わずに書いたという証明にもなるだろう。
日立は今後、各国の法整備に応じて同技術の事業計画を策定していく考えだ。米OpneAIやGoogleといった生成AIを開発する企業を潜在顧客としてとらえている。
「文章に対する電子透かし技術はまだ発展途上で、お金稼ぎのフェーズではない。技術導入を進めるために、課題を一つひとつ解決していき、さらなる技術の向上を目指す」と永塚氏は意気込みを見せた。