急速に進化を続ける生成AIだが、一方で精度という点ではまだ課題が多い。生成AIの精度向上に寄与し得る技術にはさまざまなものが考えられるが、その1つがPDFだという。確かに、ビジネスではすでに欠かせない存在となっているPDFだが、それがどのように生成AIの精度と関係してくるのか。
今回、PDFの技術団体である「PDF Association(以下、PDFA)」のCEO ダフ・ジョンソン(Duff Johnson)氏、CTO ピーター・ワイアット(Peter Wyatt)氏、ボードチェアマン代表 ラフ・ヘンズ(Raf Hens)氏が来日。編集部では、生成AIにPDFがもたらすインパクトと、乗り越えるべき課題について聞く機会を得た。
PDF関連技術の標準化と普及を推進
ーーまず、PDFAという組織についてご説明をお願いします。
ジョンソン氏:PDFAはPDF技術の普及と標準化を推進することを目的に2006年に設立された国際的な団体です。組織のスタッフとしては米国、ドイツ、オーストラリアにフルタイム従業員4人、そしてパートタイム従業員が4人所属しています。PDFAには世界中のPDF技術の専門家や関係者、ソフトウエアベンダー、サービスプロバイダーが加入しており、日本からはスカイコム、ウイングアーク1stといった企業が加入しています。
PDFAの具体的な活動としては、まずPDF関連技術の標準化が挙げられます。ISO(国際標準化機構)と連携し、PDFの長期アーカイブやアクセシビリティ、印刷などの国際標準の策定に尽力しています。
例えば、ピーター(ワイアット氏)はPDFAのCTOであり、現在はPDF形式の電子メールをアーカイブするための技術開発を主導する立場です。また、PDF技術に関するセミナーやワークショップを開催してユーザーに対する教育を行ったり、国際会議や展示会といったイベントを主催したりして、最新の技術情報の共有を図っています。
ヘンズ氏:今回はPDFAが主催する「PDF Week Tokyo」というカンファレンスへの出席を主目的に日本を訪れました。カンファレンスには日本から日本文書情報マネジメント協会という団体が参加したほか、韓国や中国、イラン、オーストラリア、ベルギー、ドイツ、英国、米国、ケニアからも代表者が参加しています。こうした多くの国のメンバーが集まり、PDFのテクノロジー全般について情報共有を行っているのです。
規格としてのPDF - その特性と遂げてきた進化
ーー改めて、PDFという規格の歴史や特徴について教えてください。
ワイアット氏:PDFは1993年、米Adobeによって開発されました。(当初はプロプライエタリだったが)2008年以降はオープンスタンダードとなり、特定のベンダーが専有する規格ではなくなりました。
PDFはベンダーの努力により現在に至るまでさまざまな進化を遂げてきましたが、もともと使いやすい規格であるためか、ユーザーの多くはその進化に気づいていないかもしれませんね。例えば初期、PDFを閲覧するには、そのためのソフトウエアをインストールする必要がありました。しかし、現在ではWebブラウザでPDFが閲覧できるようになっています。
他にも国や地域ごとの独自の仕様に対して、細かく対応を進めてきました。例えば日本の例を挙げると、新元号である「令和」の合字への対応や漢字に読み仮名をふる「ルビ」の表示、「割注」などもサポートしています。
PDFの特徴はさまざまなソフトウエアの間で相互運用が可能であり、プラットフォームに依存しないことです。つまり、すべてのOSとハードウェアで同じように運用できるわけです。
さらにPDFは高い信頼性とアーカイブ性を備えています。専用のソフトウエアを用いればPDFを編集することは可能ですが、編集履歴はすべて残すことができます。さらに編集自体を禁止する機能もあります。アーカイブ性については、PDFが誕生した1993年に作成されたファイルが現在でも問題なく開けることを考えれば明白でしょう。こうした品質面でPDFはライバルが存在せず、ビジネスには不可欠と言えます。印刷技術が多く活用されている日本においては、特に当てはまるはずです。
PDFが生まれた1993年は、HTMLがリリースされた年でもあります。そこからPDFはHTMLと同様、長い期間存在し続けてきました。PDFは改ページ、カラー管理、墨消しのサポート、デジタル署名のサポートなどWebにはない重要な機能を提供しているため、今後も汎用デジタルドキュメント形式として存在感を高めていくでしょう。
重要な情報を保持するPDFで学習したい生成AI - 課題は?
ーー現在、生成AIが急速な発展を遂げています。先日はAdobeがPDFの内容を生成AIで要約する機能をAcrobatに搭載したことが報じられました。今後、生成AIでPDFはどう変わるのでしょうか。あるいは、PDFが生成AIの発展に与える影響は何が考えられるでしょうか。
ワイアット氏:まず前提としてお伝えしておきたいのは、生成AIがPDFの提供する価値にネガティブな影響をもたらすことはないということです。それを踏まえた上で、生成AIとPDFの関係性についてですが、生成AIはユーザーがアップロードしたPDFの内容を読み取り、ユーザーのプロンプトに応答する機能を備えています。また、生成する回答をPDF形式で出力することも可能です。
ジョンソン氏:重要な点は、政府や自治体、民間企業などが作成した重要な文書の多くがPDFファイルだということです。ということは、生成AIが重要性の高い情報を学習しようとするなら、PDFは第一に考慮すべきテクノロジーだと言えます。生成AIは高い信頼性と重要性を持つPDFを必要としているため、PDFコンテンツを生成AIに取り込みたいというニーズは高まり続けるでしょう。
ーー先日、Adobeから生成AIを使ったPDF要約機能が発表されましたが、生成AIとPDFを使ったサービスにはほかにどんなものがありますか。
ヘンズ氏:生成AI活用はPDF分野で急速に成長している分野であり、多数のサービスがベンダーから提供されています。例えば、PDFの要約であれば「AI PDF Summarizer」、アイデア出しなどをサポートするAIアシスタントを搭載したPDFエディタ「UPDF」などはその一つです。
ーー生成AIがPDFを学習する際の課題はあるのでしょうか。
ジョンソン氏:生成AIがPDFを正確に読み取ることは、実はWebやその他のドキュメントを読み取るよりも難しいと言えます。例えば、日本語を文字化けしたデータとして認識し、「これはスラブ語だ」と誤って理解してしまったりするのです。ちなみに「文字化け」は英語でも「Mojibake」と呼びます。またPDFには注釈機能を使ってメモを追加できますが、生成AIがこのメモまで認識できるかは分かりません。
ワイアット氏:ほかにも課題があります。日本向けのPDFの機能としてルビや割注があるとお話しましたが、こうしたPDFのディテールも生成AIは認識しません。これらが失われると、PDFの内容を生成AIが誤って学習する可能性があり、それがハルシネーションを生むリスクもあります。
生成AIは現在、文章をシンプルなテキストとしてしか読み取りませんが、世界にはさまざまな言語文化が存在します。生成AIにはそうした豊かで複雑な言語文化まで認識できるようになってほしいと思います。
* * *
今後、生成AIはPDFのデータを学習していくことで、さらなる精度の向上が期待できる。ただし、それは生成AIがPDFの内容を正確に読み取れたらの話だ。ジョンソン氏らの話にもあったように、生成AIがPDFを読み取る能力にはまだ多くの課題が残されている。それらをいかに早く解決できるかが、生成AIの成長の鍵となるだろう。