アリババクラウドは9月19日(中国現地時間)、年次イベント「Apsara Conference 2024」において、新たに立ち上げた100種類以上のLLM(Large Language Models:大規模言語モデル)「Qwen 2.5」を世界のオープンソースコミュニティに公開したことを発表した。

また、同社はAIコンピューティング需要に対応するために設計したフルスタックのインフラの刷新についても発表。この新しいインフラには、コンピューティング、ネットワーキング、データセンター・アーキテクチャを強化するクラウド製品とサービスが含まれる。

  • アリババクラウド 最高技術責任者(CTO)周靖人(Jingren Zhou)氏

    アリババクラウド 最高技術責任者(CTO)周靖人(Jingren Zhou)氏

100種以上のモデルを公開

同社が新たに公開したオープンソースのQwen 2.5モデルは、5~720億のパラメータサイズを持つ。ナレッジを強化するとともに、数学やコーディングの機能を向上、29以上の言語に対応する。自動車、ゲーム、科学研究などのさまざまな分野におけるエッジやクラウドのAIアプリケーションをサポートするという。

これまでにQwenモデルはオープンソースAIコミュニティの主要プラットフォームであるHugging Faceや、アリババによるオープンソースコミュニティ「ModelScope」などのプラットフォームにおいて、4000万回以上のダウンロードを記録しているという。Hugging Face上では5万を超えるモデルが作成されているとのことだ。

今回のQwen 2.5リリースでは、100以上のモデルがオープンソース化される。このラインアップにはベースモデル、指示モデル、さまざまな精度レベルと手法の量子化モデルを含み、言語、音声、映像などの多様なモダリティに対応する。コードや数学に特化したモデルも提供される。

  •  Qwen2.5-Maxの評価スコア

    Qwen2.5-Maxの評価スコア

マルチモーダル領域の拡大

同社は画像生成モデル「通義万相(Tongyi Wanxiang)」ファミリーの一部として、テキストからビデオを生成する新たなモデルも発表している。このモデルはリアルなシーンから3Dアニメーションまで、さまざまなスタイルの動画を生成可能だという。

中国語や英語のテキスト指示に基づいて動画を生成するほか、静止画像を動画に変換することもできる。このモデルはディフュージョントランスフォーマー(DiT)アーキテクチャを採用しており、ビデオの再構築品質を向上させている。

また、同社は視覚と言語を統合したモデル「Qwen2-VL」についても発表。このモデルは20分以上のビデオを理解し、動画ベースの質問応答をサポートする機能を備える。このモデルは高度な推論と意思決定能力を備えており、スマートフォン、自動車、ロボットに統合されて特定の操作の自動化を容易にするように設計している。

さらには、プログラミング分野向けにQwenを活用したAIアシスタント「AI Developer」を発表。このAIアシスタントは要件分析、コード作成、ソフトウェアバグの特定と修正などのタスクを自動化する。これにより、開発者はより重要な業務に集中し、スキルを向上させられるとのことだ。

フルスタックAIインフラのアップグレード

アリババクラウドは、グリーン・データセンター・アーキテクチャ、データ管理、モデルのトレーニングと推論に関するアップデートについても発表した。

次世代データセンター・アーキテクチャにおいては、「CUBE DC 5.0」を発表。これは風力と液体を使ったハイブリッド冷却システムや、直流配電アーキテクチャ、スマート管理システムといった最新技術を駆使し、エネルギー効率と運用効率を向上させる。同時に、プレハブモジュール設計により従来のデータセンター構築に比べて導入時間を最大50%短縮可能。

データ活用を支援するオープンレイクソリューションでは、企業がAIアプリケーションに必要な膨大なデータを効率よく管理できる「Alibaba Cloud Open Lake」を発表した。このソリューションはビッグデータエンジンをシームレスに統合し、ワークフローやパフォーマンスの最適化、堅牢なデータガバナンスを一元化する。これにより、コンピューティングストレージの分離、明確なデータガバナンス、コストと時間の大幅な削減を通じてリソースの効率的な使用を支援する。

AIスケジューラでの効率的なリソース管理について、クラウド上でのモデルのトレーニングと推論を一元的に管理する「PAI AI Scheduler」を発表。これは、コンピューティングリソース管理を強化するために設計された独自のクラウドネイティブなスケジューリングエンジン。多様なコンピューティングリソースの効率的な統合、柔軟なリリーススケジューリング、タスクのリアルタイム調整、自動障害復旧を活用することで、90%以上の効果的なコンピュート利用率も達成可能だとしている。

また、組織がデータを効率よく管理し最大限に活用できるよう、「DMS OneMeta+OneOps」を発表した。このプラットフォームは複数のクラウド環境にまたがるデータベース、データウェアハウス、データレイクの40種類以上のデータソースを一元的に管理し、データの利用率を10倍に引き上げ、データを価値ある情報に変換する際の効率性向上をサポートするという。

同社は第9世代となるEnterprise Elastic Compute Service(ECS)インスタンスについても発表した。この最新のECSインスタンスは前世代と比較して、検索やレコメンデーション速度を30%向上させ、データベース製品におけるQPS(Queries Per Second)の読み書き効率を17%改善するなど、性能向上が図られている。