アリババクラウドは1月21日(インドネシア西部標準時)、年次開発者サミットにおいて、LLM(Large Language Models:大規模言語モデル)やAI開発ツールの拡充、インフラのアップグレードに加え、開発者を支援する新たなプログラムについて発表した。低コストでの革新的なAIアプリケーションの構築とグローバルな生成AIコミュニティの発展を支援するという。
基盤モデルと開発ツールを提供
アリババクラウドによるLLMファミリー「Qwen」シリーズの最新版であるQwen2.5シリーズ(パラメータ数は70億~720億)が、同社の生成AI開発プラットフォーム「Model Studio」を通じてAPI(Application Programming Interface)経由で利用可能となった。また、視覚認知モデルの「Qwen-VLシリーズ」、画像生成モデルの「Wanx2.1(通義万相)」、音声言語モデル「Qwen-Audio」を含むマルチモーダルAIモデルについても提供を開始した。
また、Qwen 2.5-coderモデルを活用したアリババクラウド独自のAIコーディングアシスタント「通義霊碼(Tongyi Lingma)」も利用可能となる。このAIプログラマはコードの補完や最適化、デバッグ支援、コードスニペット検索、バッチ単体テスト生成などの機能を備える。これにより、開発者は効率的なコーディングと生産性の向上が期待できるという。
Model Studio上では、より多様なAI開発ツールが利用可能になった。複雑なタスクをサブタスクに分割してワークフローを管理する「Workflow」や、複数のエージェントが協力して計画・実行を行う「Agent」などを提供する。
その他、外部情報源を活用して生成AIモデルの精度と信頼性を向上させる「RAG(Retrieval-Augmented Generation:検索拡張生成)」、複数のプロンプト入力に対して同時に応答を生成する「Batch Inferencing」、モデルの自動評価を行う「AutoEval(Automated Model Evaluation)」、モデルのデプロイおよびアプリケーションの可観測性サービスも1月中に利用可能となる予定。
AI開発のためのアップグレードされたインフラストラクチャ
AIをはじめとする重要なワークロードを支える強力な計算能力を提供するため、アリババクラウドは第9世代のエンタープライズ向けECS(エラストリック・コンピュート・サービス)インスタンスを4月よりグローバルに提供開始すると発表。
この最新世代のECSインスタンスは前世代と比較して計算効率が20%向上している。さらにはeRDMA(エラストリック・リモート・ダイレクト・メモリ・アクセス)を活用したネットワーク加速により、高性能コンピューティング、検索レコメンデーション、Redisデータベースのサポート性能が最大50%向上している。
同社は「Alibaba Cloud Container Compute Service(ACS)」を1月から顧客向けに提供開始することも発表した。同サービスはコンテナ技術を活用して作業負荷の展開を簡素化し最適化するよう設計されており、コンテナサービスとクラウドコンピューティングリソースを統合する。これにより、コストや技術的な複雑性が削減され、開発者はインフラ管理ではなくイノベーションに専念できるようになるとのことだ。
新たなGenAIプログラム
アリババクラウドはイノベーションを促進するため、生成AIアプリケーションの構築にQwenモデルを活用する開発者やスタートアップを支援する専用のプログラム「Alibaba Cloud GenAI Empowerment Program」を発表した。
プログラムの参加者は無料のクラウドクレジット、トレーニングワークショップ、テックショーやデモデイへの招待、さらには製品の共同マーケティング機会など、さまざまなサポートが受けられる。
Qwenを活用したアプリケーション開発の例
日本のAI開発企業であるAxcxeptはQwen 2.5 LLMを用いたオープンソースの軽量AIモデル「EZO」を開発した。EZOモデルはコーディング、情報抽出、数学、推論、ロールプレイ、日本語の文章作成といった分野で高い性能を発揮するという。低遅延かつ高性能なEZOは医療や公共機関などの日本市場向けに設計され、安全かつ効率的なAIアプリケーションを提供するとのことだ。