SambaNova Systemsは2月28日(米国時間)、50種類以上の高品質オープンソース生成AIモデルで構成されたエンタープライズ向け1.3兆パラメータの生成AIモデル「Samba-1」を発表した。
生成AIの急速な発展に伴い、多くの企業がAIの活用を進めようとしている一方、AIを安全に活用していくためのセキュリティガイドラインの策定なども急ピッチで進められており、AIの活用は新たな段階に進もうとしている。
Samba-1は、そうした時代の企業(エンタープライズ)のAIニーズに応えることを目指して開発されたものだという。SambaNovaのCCO(Chief Customer Officer)のリチャード・ハルケット氏は、「2022年以降、AIに対する関心が高まりを見せてきたが、多くの顧客は必要とするものをAIから得ていないと感じていた。顧客が期待しているのはChatGPT並みの利便性と、実用に耐えうる正確性を担保したAIで、その実現のためにはビジネスの専門性を熟知する必要があるほか、セキュリティにも配慮する必要があると感じていた。また、企業の事業主が求めているのは、AI資産の所有権と規制への対処とコンプライアンスの順守であり、AIを戦略的なビジネス上の資産として保有したいという思いがある」とし、AIの活用が進んだ現在、大規模モデルの開発コストに加え、実際にそれを活用する際に生じる推論コストをどこまで払い続ける必要があるのか、という問題を解決する必要性を強調。SambaNovaはこの6年間の事業活動の間、顧客の意見に耳を傾け、フルスタックモデルの提供を推進。専用チップを基盤とすることで、低コストでそれを実現することを目指してきたとする。
現在のSambaNovaの使命は、すべての企業が独自のプライベートGPTを構築できるように支援することだしし、その実現のために開発されたのがSamba-1だとする。
多数のエキスパートモデルを組み合わせて1兆超えのパラメータを実現
Samba-1の最大の特徴は、54(2024年2月時点)のオープンソースのものも含めた小規模なエキスパートモデルを1つの大規模モデルに結合し1.3兆パラメータを実現したこと(エキスパートモデルは後からも追加可能であり、企業独自のデータも追加することもできる)。SambaNovaプラットフォームと組み合わせて利用することで、大規模モデルとしても、特定分野向け専門モデルでも柔軟に構築することを可能としたとするほか、その構築コストもオープンソースを活用することで低減。また、必要とされるセキュリティについても、独自のAI半導体「SN40L」を活用することで、高い性能を実現しつつ、低コストで担保することを実現したとする。
これにより、例えば財務部門のエキスパートAIとして、アクセスした社員IDなどから財務部門の人間かどうかを判別し、アクセス権の有無を判断したうえで、アクセスが可能な人物であれば、正確な売り上げ情報などを提示するといったことを容易に構築ことができるようになるとしている。
「Samba-1は、大規模モデルでもエキスパートモデルでも必要な要件すべてを満たしたもの。低コストで専門性、高い正確性、そしてシンプルなUIによる使い勝手。また、所有権もユーザー企業が有しており、推論を繰り返しても追加コストの発生はない」と同氏は、そのメリットを強調する。
また、Samba-1を活用するために3つのツールが提供されることとなっている。1つ目は、従来から提供してきた「SambaNova Suite」で、Samba-1はSambaNova Suiteの一部として提供されるものという位置づけで、カスタマイズなどにはSambaNova Suiteを用いる形になるという。2つ目は「Samba Apps」で、SambaNova Suiteが提供するAI対応アプリケーションをテストすることを可能とするものだという。そして3つ目が「Sambaverse」で、開発者向けのオープンソースとして提供されるツール。Hugging Faceの複数のオープンソースエキスパートモデルとSamba-1で構築したAIモデルの性能などを比較検討することが可能なツールで、課題抽出などにも活用できるという。
なお、Samba-1は推論向けツールで、SN40L以降の同社のAI半導体で対応していくこととなり、現状はSN40Lが最適な環境だとしており、クラウドベースでのサービスのみならず、サーバベースでも提供していくとしており、セキュリティなどの観点からオンプレミスでの利用も可能だとしている。