「䞖界で初めお、生成AIによっお䜜成された文章に電子透かしを2重、3重ず倚重に入れられる技術を開発した。これによっおほが100%の確率で文章の生成元を芋抜くこずができ、フェむクニュヌスなど生成AI悪甚ぞの察策に぀ながる」ヌヌ。

7月29日、報道関係者による合同取材に応じた日立補䜜所(日立) 研究開発グルヌプ 先端AIむノベヌションセンタの氞塚光䞀氏は、新技術のむンパクトをこう匷調した。「AI研究者界隈でもあたり知られおいない技術」(氞塚氏)ずいう「倚重電子透かし」はいったいどのような技術なのだろうか。生成AIをめぐる昚今の瀟䌚課題ずずもに説明しよう。

  • 日立は生成AIによっお䜜成された文章に電子透かしを2重、3重ず倚重に入れられる䞖界初の技術を開発した

    日立は生成AIによっお䜜成された文章に電子透かしを2重、3重ず倚重に入れられる䞖界初の技術を開発した

拡散するフェむクニュヌス、生成AIの「負の偎面」

䞖界的に遞挙むダヌでもある2024幎。生成AIが普及する䞭、フェむクニュヌスなどの負の偎面が身近ずなっおきおいる。珟圚行われおいる米囜倧統領遞でも、生成AIによる停情報拡散が問題化しおいる。

遞挙劚害だけでなく、著名人の停動画によるなりすたしや、孊生による詊隓やレポヌトで生成AIを䞍正に利甚するずいった事䟋も倚い。そのため、コンテンツの生成元がAIかを刀別する技術の重芁性が増しおいる。

そのような状況の䞭、欧州連合(EU)では䞖界に先駆けお包括的に生成AIに察する法芏制を5月に蚭立した。AI事業者に察し、生成AIが䜜成したコンテンツを明瀺及び怜出できる技術の導入を芁求しおいる。たた、米囜では生成AI芏制のための倧統領什が斜行されおおり、AI開発者に察し、AIが生成した画像や音声の「ディヌプフェむク」を刀別する「電子透かし」を矩務付ける方針だ。

「誰もが生成AIを安党・安心に利甚できるようにするための技術開発が加速しおいる。その第䞀歩が『情報の生成元を刀別する』技術だ」(氞塚氏)

  • 合同取材に応じた日立補䜜所 研究開発グルヌプ 先端AIむノベヌションセンタ 氞塚光䞀氏(7月29日)

    合同取材に応じた日立補䜜所 研究開発グルヌプ 先端AIむノベヌションセンタ 氞塚光䞀氏(7月29日)

電子透かしずは?

では、電子透かしずはいったいどのような技術なのだろうか。

「透かし」は、停造や改ざんから守る技術ずしお17䞖玀以降、玙幣や切手、法的文曞などで掻甚されおきた。䟋えば、7月3日に20幎ぶりに新しくなった玙幣では停造察策が匷化されおいる。1぀の透かしが停造可胜になっおしたった時のために、玙幣には日本銀行しか知らない「耇数」の透かしが入れられおおり、これによっお玙幣の䟡倀が担保されおいる。

  • 7月3日に20幎ぶりに新しくなった玙幣

    7月3日に20幎ぶりに新しくなった玙幣

そしお、デゞタルコンテンツに透かしを入れる技術が電子透かしだ。むンタヌネットの普及ずずもに、著䜜暩保護や品質保蚌ずいった芳点から、デゞタルコンテンツに䜜成者の情報を埋め蟌む技術が登堎し、画像や音声、動画などぞの導入が広たった。

電子透かしには目に芋えるものず芋えないものの2皮類がある。ストックフォトの賌入前の画像のように、ロゎやテキストなど目立぀パタヌンを埋め蟌むこずで䞍正な利甚を抑止する「可芖型」ず、コンテンツの倖芳の質は損なわず、パスワヌドのような鍵を利甚したり特殊な分析技術などを利甚したりしお怜出する「非可芖型」の2皮類だ。

氞塚氏は「可芖型は『勝手に䜿甚しないで』ずいう著䜜暩保護の意味で䜿われ、非可芖型は『䜿っおもいいけど、埌できちんず怜出できるようにするよ』ずいうコンテンツの远跡の意味で䜿われる」ず説明した。

  • 2皮類ある電子透かし

    2皮類ある電子透かし

ハヌドルが高い「文章ぞの電子透かし」

電子透かしの導入は画像や動画で先行しおおり、すでに実甚的な電子透かしがサヌビスの機胜ずしお搭茉されおいる。

䟋えば、䞭囜発の動画共有アプリ「TikTok」の運営䌚瀟である字節跳動(バむトダンス)は、2023幎9月に同瀟独自の特殊効果を䜿甚しお䜜成されたAI生成コンテンツぞのラベル付け機胜を実装した。さらに2024幎5月には、他のプラットフォヌムで䜜成された生成AIを䜿ったコンテンツにも自動的にラベルを付けるず発衚。

  • TikTokの「AI Generatedラベル」

    TikTokの「AI Generatedラベル」

たた非可芖型の䟋ずしおは、米Google傘䞋のDeepMindは2023幎8月にAI由来のデゞタルコンテンツに電子透かしを埋め蟌むツヌル「Synth ID」を発衚。画像や音声、動画などさたざたなメディアに芋えない透かしを導入しおいる。

  • ç±³Google傘䞋のDeepMindの「Synth ID」

    ç±³Google傘䞋のDeepMindの「Synth ID」

ビックテックを筆頭に電子透かしの導入が進んでいる䞀方で、「文章ぞの電子透かしはハヌドルが高く、導入が遅れおいる」ず氞塚氏は指摘する。文字の持぀特性䞊、文章ぞの透かしは簡単に改ざんされおしたう恐れがあるずいう。

画像や動画の透かしの堎合、色ず䜍眮を決める最小単䜍「ピクセル」を1぀倉えおもコンテンツぞの圱響が少ないが、文章は文字を1぀でも倉えるず意味が倉わっおしたう。冗長性の䜎さから、文章そのものに透かしを入れるこずは困難ずされおきたずいう。

こうした流れを倉えたのは、米メリヌランド倧孊に所属する研究者らが2023幎に発衚した1぀の論文だ。

「特定の単語の割合が高い」「生成AIが䜜った文章」

メリヌランド倧孊の研究者が発衚した文章ぞの電子透かしの仕組みはこうだ。

倧芏暡蚀語モデル(LLM)によっお実珟する生成AIは、特定の蚀葉に続く確率が高いず考えられる蚀葉を䞊べるこずで文章を生成しおいるが、この際にAIが「特定の単語」を自動的に遞ぶように现工する。

具䜓的には、1぀前の単語から予枬されるすべおの単語を緑のグルヌプ(透かし察象)ず灰色のグルヌプ(透かし察象倖)に分け、生成AIは文章を生成しながらリアルタむムで特定の単語のワヌドリストを自動生成し、曞き出す文章に反映する。

  • 文章ぞの電子透かしの仕組み

    文章ぞの電子透かしの仕組み

぀たり、高い割合で特定の単語が文章に採甚されおいる状態であれば、その文章はAIが生成した確率が高いずいうこずになる。緑のグルヌプの単語の割合が圧倒的に倚い文章は確率的に「透かしあり」で、生成AIが曞いたず刀断できる。人間が曞いた文章の堎合は、灰色ず緑のグルヌプの単語が半々くらいになるからだ。

どの蚀葉が特定の単語なのかは、パスワヌドのような鍵を䜿甚しないず怜出できない仕組みだ。たた、この鍵がなければ、透かしを䜜成するこずもできない。

日立が開発した䞖界初の技術「倚重電子透かし」

しかし、もしこの鍵がハッカヌなど悪意のある人間の攻撃によっお挏掩しおしたうず、䞍特定倚数の人物が透かしを再珟できるようになり、生成元の刀別が䞍可胜になっおしたう。玙幣の堎合で考えるず、日本銀行しか知らない透かしが倖郚に挏れおしたえば、流通しおいるすべおの玙幣に぀いお真停を刀断できなくなるだろう。

そこで、日立は䞖界初だずいう生成AIによっお䜜成された文章に電子透かしを2重、3重ず倚重に入れられる技術を開発した。2重透かしの技術ずしおも日本初だずいう。

  • 日立が開発した「倚重電子透かし」

    日立が開発した「倚重電子透かし」

透かしを「2重で入れる」ずはどういうこずだろうか。氞塚氏はこう説明した。

「透かしの察象ずなる緑のワヌドリストの䞭から特に遞ばれやすい『濃い緑』のワヌドを遞定し、それを文章に反映させる。これが2重目の透かしずなり、1぀目の透かしの鍵が挏掩しお透かしが停造されおも、2぀目の透かしで生成元を刀別できるようになる」

ロゞックはメリヌランド倧孊の研究者が開発した技術ず同じだが、それを倚重で入れられるようにした。倚重透かしでより堅牢にするこずで、高い粟床で生成元を刀別できるようになるずいう。氞塚氏によるず、98.8%以䞊の粟床で第2透かしを怜出できるずいう。

しかし、この“倚重"には䞊限がある。この透かし技術の粟床は文章の長さに䟝存するからだ。統蚈的に刀断しおいるため、文章が長くなればなるほど、぀たり単語数が増えれば増えるほど透かしの粟床は高たる。

「倚重に透かしを入れるずいうこずは、単語のグルヌプ分けを倚重に行いどんどん现分化を行うずいうこず。2重でも十分な粟床を出すこずができるため、珟状の䞊限は34重だず考えおいる。小説ずいった長い文章であれば、3重以䞊の透かしは実甚的だろう」ず氞塚氏は予枬する。

  • 特定の単語の割合が倚い文章は「透かしあり」、぀たり生成AIが䜜った文章だず刀断できる

    特定の単語の割合が倚い文章は「透かしあり」、぀たり生成AIが䜜った文章だず刀断できる

この堅牢な文章ぞの電子透かしが普及するこずで、フェむクニュヌスず疑われる報道やSNS投皿に぀いお、誰でも生成元を確認できるようになるだろう。テキストを貌り付けるだけで翻蚳しおくれるアプリのように、疑わしい文章を読み蟌たせるだけで「これは生成AIによっお䜜られた蚘事です」ず教えおくれるアプリが誕生するかもしれない。

たた、報道機関ずいった曞き手の芳点でも、この技術は自瀟の蚘事が生成AIによっお曞かれたものかどうかを掲茉前にチェックするツヌルずしお䜿甚できる。生成AIを䜿わずに曞いたずいう蚌明にもなるだろう。

  • 「倚重電子透かし」の応甚䟋

    「倚重電子透かし」の応甚䟋

日立は今埌、各囜の法敎備に応じお同技術の事業蚈画を策定しおいく考えだ。米OpneAIやGoogleずいった生成AIを開発する䌁業を朜圚顧客ずしおずらえおいる。

「文章に察する電子透かし技術はただ発展途䞊で、お金皌ぎのフェヌズではない。技術導入を進めるために、課題を䞀぀ひず぀解決しおいき、さらなる技術の向䞊を目指す」ず氞塚氏は意気蟌みを芋せた。