オフィシャルブログ「Google Cloud Platform Blog

Googleは現地時間18日、同社のオフィシャルブログ「Google Cloud Platform Blog」において機械学習で画像認識能力を向上させていくGoogle Cloud Vision APIがベータ版になったことを告知した。

スポーツカーや寿司、鷲といった探知が可能で、顔認識から表情の感情を読み取ったり、画像上に写る文字からテキストを読み取るOCR機能なども持つ。昨年12月より限定版として数千の企業の利用を通して、数百万の画像でこの機能を試してきたが、今回ベータ版としてリリースされるにいたったことが掲載されている。料金は機能毎1000ユニット/月ごとの従量課金が予定されており、1,000イメージで2ドル(Label Detection)、同様に0.6ドル(OCR)といった価格が3月1日から予定されていることが掲載されている。

β期間中は、月あたり2千万イメージの上限があり、またCloud Vision APIはリアルタイムでのレスポンスが求められるようなアプリケーションには、向いていないことにも言及している。ほか、ドキュメンテーションへのリンクと、PythonとJavaを用いたAndroid/iOSのモバイルアプリのサンプルへのリンクも用意されている。

"running""marathon"と写真から自動的に判別しアノテーションを返す(同社オフィシャルブログより)

左の人物からは"VERY_LIKELY"と表情を、右の看板からは記載されている文字列を返している(同社オフィシャルブログより)