Red Hatは2026年3月11日(米国時間)、「Scaling Enterprise Federated AI with Flower and Open Cluster Management」において、オープンソース技術を活用し、分散環境で学習を行う「フェデレーテッドラーニング(連合学習)」を企業規模で導入する方法を解説した。
FlowerとOpen Cluster Management(OCM)を組み合わせた運用方法を示し、実稼働対応ソリューションを提供可能にするという。
オープンソース「Flower」で実現するフェデレーテッドラーニング
フェデレーテッドラーニングはデータをモデルに持ち込むトレーニング手法ではなく、モデルをデータに持ち込むトレーニング手法とされる。トレーニングはローカル環境(組織やエッジデバイスなど)で行われ、モデルの更新結果のみが中央コーディネーターと共有される仕組み。
学習データを外部に持ち出す必要がないため、医療や金融組織に要求されるプライバシー規制を守りながらAIモデルを構築できる。Red Hatは企業向けソリューションとして、「Flower Framework」をRed Hat Advanced Cluster Management for Kubernetesのオープンソース基盤である「Open Cluster Management」と組み合わせる方法を説明した。
Flowerはフェデレーテッドラーニング向けのオープンソースフレームワークだ。主要な機械学習コードを変更することなく、フェデレーテッド環境に移植できる特徴がある。活発なコミュニティに支えられ、大手テクノロジー企業での採用も進んでいるとされる。
構造はハブアンドスポーク方式が採用されている。中央サーバ(ハブ)がトレーニングを調整し、複数のクライアント(スポーク)がタスクを実行する。学習に使用する生データはクライアントの外部に持ち出されることはなく、中央にはモデルの更新結果のみが返される。この仕組みにより、厳しい制約が課される環境下においても利用することができる。
また、Flowerは学習処理と通信処理を分離する仕組みを備える。長期間の動作を必要とする通信処理はSuperLinkとSuperNodeが担当し、短時間動作にとどまる学習処理はServerAppとClientAppが担当する。これにより、開発者は既存のトレーニングロジックをClientAppにラップすることで、移植コストを最小限に抑えることができる。
オープンソース基盤で実現する企業規模のフェデレーテッドAI
企業規模で多数の端末やクラスタを扱う場合、学習基盤そのものの展開や維持に手間がかかる。証明書の扱い、端末の選別、障害復旧、更新の適用など、運用面の課題が増える。Flower単体でも展開方法は用意されているが、数百規模の環境を扱う際には、より体系的な管理が求められる。
そこでOpen Cluster Management(OCM)が登場する。OCMは、複数のKubernetesクラスタを管理するRed Hat Advanced Cluster Management for Kubernetes(ACM)のアップストリームプロジェクトとされる。
FlowerとOCMの構造は近く、OCMが管理するクラスター上で、追加のネットワークトポロジやインフラストラクチャを変更することなくFlowerを実行できる。この共通アーキテクチャにより、FlowerとOCMコンポーネント間では次のマッピングが成立する。
- SuperLink → Hub Cluster
- SuperNode → Managed Cluster (Klusterlet)
- ClientApp → ManifestWork
機能面の補完性も提供されており、OCMはFlowerを大規模展開するネイティブプラットフォームと言える。さらに「flower-addon」は両者を結び付ける役割を担い、マルチクラウド環境全体でのフェデレーテッドラーニングワークロードの自動分散およびオーケストレーションを支援する。
Red HatはFlowerとOCMを統合することで、エンタープライズグレードのフェデレーテッドラーニングが実現可能としている。

