Googleは現地時間2023年2月22日、Google CloudのDocument AI WorkbenchがGA(一般提供版)に達したと公式ブログで発表した。
2022年10月に開催したGoogle Cloud Next '22でパブリックプレビュー版の提供を開始し、非構造化ドキュメントに対するデータ抽出の精度を高めるCDE(Custom Document Extractor: カスタムドキュメント抽出)機能が注目を集めていた。同社によれば「CDEは開発者やアナリストが独自データによるモデル学習や、業務に必要なドキュメントファイルから(必要な)領域の抽出が可能。より少ないデータで迅速なモデル構築とデータ処理&分析による投資効果の達成を加速させる」という。Document AI Workbench GA版はAPIを用いたモデル作成や削除、トレーニング、評価、展開の省略化。データセット作成時の柔軟性向上やDocument AI Toolboxの更新など複数の改善を加えている。なお、Google Cloudのホスティングや予測処理のみ料金が発生し、データインポートやトレーニングに費用は発生しない。詳細は公式ページを参照してほしい。また、今後はCDC(Custom Document Classifier: カスタムドキュメント分類子)を用いたドキュメントファイルの分類や、50ページ超のドキュメントファイルへの対応、本番環境と開発環境管理の合理化を予定している。