凸版印刷は6月1日、古文書の解読とくずし字資料の利活用を支援するサービス「ふみのは」事業の一環として、スマートフォンで撮影したくずし字資料をAI-OCR(Optical Character Recognition/Reader:光学文字認識)技術によりその場で手軽に解読可能な、iOS版くずし字解読アプリ「古文書カメラ」の配信を開始したことを発表した。

  • 「古文書カメラ」を開発した

    「古文書カメラ」を開発した

今回開発したアプリケーションは、木版を用いて印刷されたくずし字資料に対応したAI-OCRを搭載している。また、手書きの古文書にも対応するAI-OCRを新たに開発して搭載し、幅広い資料の解読を支援するとのことだ。資料館などでの古文書の解読や調査業務の効率化をサポートする。さらに、一般利用者の「手元にある古文書の概要を知りたい」「くずし字を読めるようになりたい」といった需要にも対応するという。

くずし字で書かれた資料は、木版を用いて印刷されたもの(版本や錦絵など)と、手書きのもの(書簡や証文、日記などの古文書)があり、それぞれ文字の形や字種が異なる。同社によると、このアプリケーションは手書きと版本のくずし字に対応する2種類のAI-OCRを搭載しており、精度は解読率90%とのことだ。

  • 資料による字種の違い

    資料による字種の違い

アプリケーションでは、AIにすべてを任せる「フルオートモード」と、高精度な読み取りが可能な「範囲選択モード」から機能を選択して使えるという。フルオートモードは画像の中にある文字領域を自動で検出し、つなげて書かれた文字の区切り位置なども含めてAIがくずし字を解読する。もう一方の範囲選択モードでは、選択した数文字に対してAIが候補文字を複数提示する。

  • 両モードの画面の例

    両モードの画面の例