AI開発を行う企業モルフォAIソリューションズは、明治・大正・昭和初期の近現代書籍・雑誌を高精度で読み取ることが可能なAI-OCR「FROG AI-OCR」を7月1日より販売する。

  • 「FROG AI-OCR」の利用イメージ(同社資料より)

    「FROG AI-OCR」の利用イメージ(同社資料より)

地方図書館や自治体向けに、デジタルアーカイブ事業や読書バリアフリー法などへの対応ニーズに応えて提供する「FROG AI-OCR」は、国立国会図書館からの委託事業として開発されたAI-OCRエンジンを活用しており、特に明治・昭和初期の近現代文の読み取りに強みを持つ。読み取るレイアウトも古書に多い年表式や多段組のレイアウトや、古書ならではの書式「頭注」「割注」「ルビ」「柱」「ノンブル」や旧字・旧仮名・異体字、「(」「【」「~」などの記号や英数字などにも対応する。

  • 古書の複雑なレイアウトにも対応(同社資料より)

    古書の複雑なレイアウトにも対応(同社資料より)

  • 古書の多様な旧字・旧仮名・異体字への対応(同社資料より)

    古書の多様な旧字・旧仮名・異体字への対応(同社資料より)

Webサービスで提供する「FROG AI-OCR」は、一般のスキャナーやスマートフォンなどで撮影した画像をアップロード、後はAIが自動処理を行いページごとにフォルダに分割された画像とテキストを出力する。専用ページで校正することも可能で、修正したデータをテキストとして出力できる。現在、Webサイトで無償トライアルの受付を実施している。