米Googleは12月13日(現地時間)、最新のAIモデル「Gemini」の初期導入とフィードバック収集を兼ねたAPI提供を開始した。Webベースの開発者ツール「Google AI Studio」と、Google CloudのフルマネージドAIプラットフォーム「Vertex AI」で、1分あたり最大60リクエスト(60QPM)まで無料で利用できる。
13日にAPIでの利用が可能になったのは、コストやレイテンシがバランスよく最適化された中規模のモデル「Gemini Pro」である。日本を含む世界180以上の国・地域で利用でき、日本語を含む38言語をサポートしている。現段階でGemini Proはテキスト入力(コンテキスト・ウインドウは32K)とテキストの生成出力に限定されているが、Geminiは異なるモダリティで最初から事前訓練されたマルチモーダル対応のAIモデルであり、13日にGoogleはテキストおよび画像の入力を受け付け、テキストを出力するGemini Pro Visionマルチモーダルエンドポイントの提供を開始した。Gemini ProにはSDKが用意されており、Python、Android (Kotlin)、Node.js、Swift、JavaScriptをサポートしている。Android Studio、Colab、Project IDXで利用可能なクイックスタートテンプレートをAI Studioでも使用できる。
Vertex AIでは、企業独自のデータを用いてGeminiモデルをカスタマイズし、企業特有のニーズに基づいた出力の調整が可能である。これによりモデルのパフォーマンスが向上する。また、リアルタイムのデータや情報を取り入れたり、モデルを実世界のタスクやアクションに結びつけるツールで拡張することで、情報提供を超えた活用が可能になる。この開発プロセスでは、検索拡張生成 (RAG:Retrieval Augmented Generation)、ブレンド検索、埋め込み(Embeddings)、会話プレイブックのサポートなどを含む、ローコード/ ノーコードの環境で、幅広いスキルレベルの開発者がGeminiを活用した検索エージェントおよび会話型エージェントを構築できる。
試験的導入期間を経て、来年初めのGA(General Availability)と共に提供が始まるGemini ProのPay-as-you-goプランは、入力が0.00025ドル/1000文字、0.0025ドル/1画像。出力が0.0005ドル/1000文字となっている。