LINE、昭和前期以前の資料にも対応するOCRを開発

LINEのAIカンパニーは9月7日、国会図書館が保有するデジタル化資料247万点、2億2300万画像を対象とした「デジタル化資料のOCRテキスト化」作業を受託し、「CLOVA OCR」の技術によるモデル開発を実施して全文のテキストデータ化が完了したと発表した。

CLOVA OCRは、書類や画像の文字などの情報をテキストデータへ変換するサービス。文書解析と認識に関する国際会議ICDARにおいて、2019年3月には4分野で世界1位の評価を得たという。

今回テキストデータ化を行ったデジタル化資料の多くは昭和前期以前の資料であり、レイアウトも複雑なため、既存のOCRでは同プロジェクトに必要な精度に達しないことや、2億2300万枚を超えるデジタル化資料の処理に時間を要する点が課題だったとのこと。

改善結果報告書の抜粋

そのため、同社のAI-OCRモデル研究開発チームは、CLOVA OCRの技術を基に、同プロジェクト用のOCRモデル開発を実施したという。

結果として、全33区分中、1970年代に出版された雑誌資料を除く32区分で国会図書館の目標値よりも高い認識性能を発揮するモデルが完成し、全文テキストデータ化に寄与したとのこと。

なお、改善結果や同プロジェクト結果の詳細は、国会図書館がNDLラボで公開している。

LINE、昭和前期以前の資料にも対応するOCRを開発

AIが勧める、あなたのための会員限定記事

「要件定義は不要」、ヒロ・ビジネス広川氏が語るERP導入失敗の根本原因とは

AIは新たな「内部脅威」なのか　企業が見直すべきデータ管理の課題

Meta、クラウド事業に参入か？AIモデルと計算資源の外販を検討 - CDOも新設

SK hynix、Samsung、Amkorの3社が韓国南西部地域に総額896兆ウォンの投資を計画韓国政府発表

インフィニオン、ams OSRAMの非光学アナログ/ミクスドシグナルセンサ事業の買収を完了

ソニーGと東大、次世代人材育成に向け基金設置

編集部が選ぶ関連記事

LINE、AI-OCRのクラウドアプリサービスに「表抽出」オプションを追加

LINE、「CLOVA OCR」でレシート・領収書・請求書に特化したサービス

LINEのAI技術を利用したチャットボットなどのSaaSを提供開始

国会図書館の絶版の資料がスマホで閲覧可能に、印刷機能も提供予定

関連リンク

kintone AIプラグイン活用術 - シュシュッとAIを使おう第9回 kintoneで名刺管理を効率化、AI名刺解析プラグインをスマホで試してみた

知って得するWord使いこなし術第49回ビジネス文書でも使いやすい表デザインの書式設定

北陸電力、kintone活用で年間約3万時間の業務時間を削減

不二製油、VISA申請や海外赴任手続きをkintoneで標準化　年間116時間・70万円を削減

ソフトバンク「AGENTIC STAR」がCanvaと連携　AIエージェントが資料作成支援

知って得するWord使いこなし術第48回 AIを活用してPDFから表データをコピー＆ペーストする

このカテゴリーについて

LINE、昭和前期以前の資料にも対応するOCRを開発

AIが勧める、あなたのための会員限定記事

「要件定義は不要」、ヒロ・ビジネス 広川氏が語るERP導入失敗の根本原因とは

AIは新たな「内部脅威」なのか 企業が見直すべきデータ管理の課題

Meta、クラウド事業に参入か？AIモデルと計算資源の外販を検討 - CDOも新設

SK hynix、Samsung、Amkorの3社が韓国南西部地域に総額896兆ウォンの投資を計画 韓国政府発表

インフィニオン、ams OSRAMの非光学アナログ/ミクスドシグナルセンサ事業の買収を完了

ソニーGと東大、次世代人材育成に向け基金設置

編集部が選ぶ関連記事

LINE、AI-OCRのクラウドアプリサービスに「表抽出」オプションを追加

LINE、「CLOVA OCR」でレシート・領収書・請求書に特化したサービス

LINEのAI技術を利用したチャットボットなどのSaaSを提供開始

国会図書館の絶版の資料がスマホで閲覧可能に、印刷機能も提供予定

関連リンク

kintone AIプラグイン活用術 - シュシュッとAIを使おう 第9回 kintoneで名刺管理を効率化、AI名刺解析プラグインをスマホで試してみた

知って得するWord使いこなし術 第49回 ビジネス文書でも使いやすい表デザインの書式設定

北陸電力、kintone活用で年間約3万時間の業務時間を削減

不二製油、VISA申請や海外赴任手続きをkintoneで標準化 年間116時間・70万円を削減

ソフトバンク「AGENTIC STAR」がCanvaと連携 AIエージェントが資料作成支援

知って得するWord使いこなし術 第48回 AIを活用してPDFから表データをコピー＆ペーストする

このカテゴリーについて

「要件定義は不要」、ヒロ・ビジネス広川氏が語るERP導入失敗の根本原因とは

AIは新たな「内部脅威」なのか　企業が見直すべきデータ管理の課題

SK hynix、Samsung、Amkorの3社が韓国南西部地域に総額896兆ウォンの投資を計画韓国政府発表

kintone AIプラグイン活用術 - シュシュッとAIを使おう第9回 kintoneで名刺管理を効率化、AI名刺解析プラグインをスマホで試してみた

知って得するWord使いこなし術第49回ビジネス文書でも使いやすい表デザインの書式設定

不二製油、VISA申請や海外赴任手続きをkintoneで標準化　年間116時間・70万円を削減

ソフトバンク「AGENTIC STAR」がCanvaと連携　AIエージェントが資料作成支援

知って得するWord使いこなし術第48回 AIを活用してPDFから表データをコピー＆ペーストする