さくらインターネットは5月14日、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」を提供開始することを発表した。同サービスでは生成AIアプリケーションやLLM(Large Language Models:大規模言語モデル)をはじめとする基盤モデル、生成AI向けクラウドサービス「高火力」をつなぐAPI(Application Programming Interface)、RAG(Retrieval-Augmented Generation:検索拡張生成)向けのベクトルデータベースを提供する。

  • 「さくらの生成AIプラットフォーム」の提供を開始する

    「さくらの生成AIプラットフォーム」の提供を開始する

同サービスを試験導入した瓜生山学園 京都芸術大学では、miiboが開発したノーコード会話型AI構築サービス「miibo(ミーボ)」を、さくらのAIプラットフォーム上でNEC開発の生成AI「cotomi(コトミ)」を基盤モデルとして採用し実施している。ユーザーの選択次第では基盤からアプリケーションまでを国産サービスのみで揃えられるという。

さくらの生成AIプラットフォームの特長

同サービスは複数の基盤モデルから選択可能であり、今後も国内外問わずさまざまな企業と連携し基盤モデルの選択肢を増やす予定とのことだ。プラットフォーム上の基盤モデルを利用すればデータの通信や保管を国内完結させることも可能。

また、実行基盤の構築や管理の大半を「さくらの生成AIプラットフォーム」が担うため、手間をかけずに専門知識がなくともサーバレス環境で利用可能。これにより、ユーザーは生成AIを活用したアプリケーションの開発に注力できるようになる。

プラットフォームの基盤には、同社の生成AI向けクラウドサービス「高火力」を採用。「高火力」にはAI開発や機械学習向けに設計されたGPUの「NVIDIA H100 Tensor コア GPU」も搭載している。

  • サービス概要図

    サービス概要図