サイバーエージェントは11月9日、広告クリエイティブに特化した独自の日本語OCR(光学文字認識)モデルを開発したと発表した。同社が提供する、AI(人工知能)で効果の出せるランディング・ページを予測・制作するという「極予測LP」では既に導入が済んでおり、今後は他の「極予測シリーズ」への導入を順次進めていく予定だ。

  • 独自OCR(左)と既存の外部OCRサービス(右)による解析結果

デジタル広告で高い広告効果を創出するためには、画像やキャッチコピーなどの素材を多様に組み合わせ、ユーザーの年齢や性別、興味関心などターゲットごとに効果の期待できるクリエイティブの制作が重要だと同社はいう。

同社が提供する極予測シリーズでは、従来から広告クリエイティブの事前効果予測エンジンの精度向上に取り組んでいたが、より高精度な効果予測のためには、クリエイティブ内のテキストを正しく読み取ることが重要としている。

極予測シリーズでは既に、広告クリエイティブ内の文字を検出・解析し、クリエイティブ制作および事前効果予測のフローにOCRの技術を取り入れていたが、クリエイティブ内の文字のフォントやレイアウトは複雑化しており、従来の外部OCRサービスでは正しく読み取ることが難しいケースも増えていたという。

新モデルでは、日本語特有の縦書き表記や特殊な文字フォントに対しても高精度な文字認識を実現したとのこと。これにより、広告内の高度なレイアウト理解を可能にし、効果予測精度の向上が期待できるとしている。