米Googleは8月14日(現地時間)、Gemma 3シリーズに新たなモデル「Gemma 3 270M」を追加した。低消費電力かつ高効率なオンデバイス動作を可能とする軽量モデルである。Hugging FaceやKaggleといったプラットフォームを通じて、「Gemma Terms of Use」に基づき提供されており、開発者はすぐに試用やファインチューニングを行える。
Gemmaシリーズは、Google DeepMindが開発する「オープン」AIモデル群で、今年3月に発表された「Gemma 3」では10億〜270億パラメータの幅広い構成が用意された。5月にはモバイルファースト設計の「Gemma 3n」も登場している。
Gemma 3 270Mは2億7000万パラメータと非常にコンパクトである。Google DeepMindのオマール・サンセビエロ氏はXで、このモデルがRaspberry PiやWebブラウザでも動作可能であると述べ、その軽量性を強調した。
Gemma 3nがマルチモーダル対応であるのに対し、Gemma 3 270Mはテキスト処理に特化したモデルである。2億7000万個のパラメータのうち、1億7000万個は大規模な語彙サイズに由来する埋め込みパラメータで、1億個はTransformerブロック用となっている。25万6000トークンという大規模語彙により、特定かつ希少なトークンも処理可能。開発者が特定用途に合わせてファインチューニングすることを前提とした基盤モデルであり、強力な指示追従能力とテキスト構造化能力を備える。文章の分類や要約、特定のデータ抽出(エンティティ抽出)、顧客の感情分析といった明確に定義されたタスクであれば、大規模モデルよりも高速かつ効率的で、運用コストを大幅に削減できるとGoogleは説明している。
性能面では、AIの指示追従能力を測る「IFEval」ベンチマークテストにおいて51.2%のスコアを記録し、同規模の他の軽量モデルを上回る性能を示している。
エネルギー効率に優れ、Googleの内部テストでは、Pixel 9 Proスマートフォン上で25回の対話処理を行っても、バッテリー消費はわずか0.75%だったという。
さらにGoogleは、このモデルの活用例として、Webブラウザ上でオフライン動作する「ベッドタイムストーリー・ジェネレーター」を公開した。登場キャラクターや舞台、テーマなどをユーザーが選択すると、それらに基づいた創造的な物語を生成する。このデモは、Gemma 3 270Mがビジネス向けタスクだけでなく、クリエイティブでインタラクティブなアプリケーションにも有効であることを示している。

