米Snowflakeは4月24日(米国時間)、オープンなエンタープライズグレードの大規模言語モデル(LLM)として独自に設計された「Snowflake Arctic」を発表した。

「Snowflake Arctic」の特徴

Arcticの特徴の一つは、費用対効果が高い点。高額なコンピューティング予算でトレーニングされたオープンソースのモデルと比較しても、SQL生成、コーディング、ベンチマークに従う命令などのタスクにおいて優れているという。

  • Arcticと主要なLLMのトレーニングの費用対効果の比較 資料:Snowflake

Arcticは、トレーニング効率を上げるため、独自のMixture-of-Experts(MoE)アーキテクチャを利用している。

もう一つの特徴はオープンである点だ。Arcticは制約のない個人利用、研究利用、商用利用を認めるApache 2.0ライセンスで提供される。加えて、コードテンプレートを柔軟な推論やトレーニングの選択肢と合わせて提供し、ユーザーが好きなフレームワークを利用してArcticの展開、カスタマイズを速やかに開始できるよう支援するという。

Snowflake Arctic は、Hugging Faceから入手できるほか、Snowflake Cortex、アマゾン ウェブ サービス (AWS)、Microsoft Azure、NVIDIA API カタログ、Lamini、Perplexity、Replicate、Togetter などのモデルガーデンやカタログから数日以内に入手可能。

埋め込みモデルファミリーもラインアップ

Snowflake Arcticのモデルファミリーには、Apache 2.0ライセンスに基づいてオープンソースコミュニティに公開されたテキスト埋め込みモデルファミリーのArctic embedも含まれる。

Arctic embedは現在、Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始予定(プライベートプレビュー中)。