Snowflakeはこのほど、11月12日~15日に開催された技術者向けユーザーカンファレンス「BUILD 2024」で発表されたAIおよび機械学習製品の最新情報を紹介した。
説明会では、「データとアーキテクチャ」「エンタープライズAIとML」「データとAIのためのコラボレーション」という観点から、説明が行われた。
データとアーキテクチャ
同社はデータアーキテクチャを簡素化してデータの価値を向上し、オープンレイクハウスの使用とガバナンスの簡素化を実現している。
Apache Polaris (Incubating)のマネージドサービスであるSnowflake オープンカタログは一般提供が開始され、組織のニーズの変化に合わせて新しいエンジンを統合し、それら全体に一貫したガバナンス制御を適用できるようにする。
Document AIはAWSとMicrosoft Azureで一般提供が開始され、SnowflakeのLLMであるArctic-TILTを活用し、テキスト量の多い段落とドキュメント内のその他のコンテンツ(ロゴ、署名のような手書きのテキスト、チェックマークなど)から情報を抽出する。ユーザーは自然言語を用いてPDFなどの文書からインサイトを容易に引き出せる。
Snowflake Horizon カタログには脅威防止機能とセキュリティ監視機能が追加された。具体的には、Leaked Password Protection(近日中に一般提供開始)を通じて、ダークウェブ上で発見されたユーザーのパスワードを自動的に無効にする資格情報の盗難防止と検知機能が追加された。また、API認証用のProgrammatic Access Tokens(PATs)(近日中にプライベートプレビュー)のサポートが追加され、トークンのスコープや有効期限を含めることでセキュリティを強化しながら、アプリへのアクセスにおける開発者の作業を簡素化する。
エンタープライズAIとML
現在、さまざまなベンダーが独自のAIサービスを提供しているが、Snowflakeは企業が利用することに前提としたAIサービスを提供している。
フルマネージドAIサービスであるSnowflake Cortex AIに関しては、MetaのLlama 3.2モデルのようなマルチモーダルLLMへの対応とCortex COMPLETE Multimodal Input Supportが発表された。これらにより、画像などのマルチモーダル入力により、自社の会話型アプリを強化できるようになったほか、音声やその他のデータタイプも追加される予定としている。
また、単一のAPIでエンタープライズデータに基づいた回答をあらゆるアプリに提供する「Cortex Chat API(近日中にパブリックプレビュー)」が発表された。同APIは単一のREST APIで、アプリケーションのフロントエンド(UI)を複数のSnowflakeCortexサービスに接続することに加え、構造化データまたは非構造化データソースから関連情報を取得するためのオーケストレーションが可能。
加えて、TruEra(2024年5月に買収)の技術を統合した「AI Observability for LLM Apps」(現在プライベートプレビュー中)を使用して、開発中および本番環境の両方で、関連性、根拠、ステレオタイプ、レイテンシーに関する20以上のメトリクスで生成AIアプリを評価および監視できるようになる。
新しいナレッジベースコネクタとして、Microsoft 365 SharePointのファイルやドキュメントを利用し、ドキュメントを手動で前処理することなく自動的にファイルを取り込めるSnowflake Connector for Microsoft SharePoint(現在パブリックプレビュー中)が発表された。
ニュース記事、研究出版物、科学雑誌、教科書などのサードパーティからの非構造化データと対話するための支援を企業に提供する、Cortex Knowledge Extensionsも、現在プライベートプレビューとしてSnowflakeマーケットプレイで公開されている。これは、ニュースや研究、その他専門的な出版物の最新または独自のデータを活用することで、AIアシスタントのナレッジベースを強化しつつ、発行者の知的財産権を尊重する。
さらに、TruEraの技術を統合した「Observability for ML Models(現在パブリックプレビュー中)」による組み込みモニタリングによって、Snowflakeで推論を実行しているモデルのパフォーマンスとメトリクスを監視し、本番環境でのモデルの精度劣化を迅速に検出可能になる。
「Model Explainability(現在パブリックプレビュー中)」では、ユーザーがModel Registryに記録したモデルに対して、シャープレイ値(各特徴量がモデルの全体的な出力にどのような影響を与えているかを説明するのに役立つ、広く使用されているアプローチ)を簡単に計算することができる。
そして、ビジネスユーザーが、データの分析、要約、アクションの実行を一元管理された会話型インタフェースで行える企業AIアシスタント「Snowflake Intelligence」が発表された。
「Snowflake Intelligence」により、企業は自社のデータに対してビジネス上の質問を簡単に投げかけるだけで、データ主導型の回答が得られ、そのインサイトに基づいてアクションを実行するデータエージェントをわずか数ステップで作成できるようになるという。
具体的には、データベース内の販売取引、SharePointなどのナレッジベースのドキュメント、Slack、Salesforce、Google Workspaceといった生産性ツール、Snowflake内のビジネスインテリジェンスデータなどのサードパーティツールとシームレスに接続する。
データとAIのためのコラボレーション
同社は、データとAIのためのコラボレーションにより、「データ、AIモデル、アプリケーションを簡単に検索・評価・共有すること」「エンタープライズデータとAI製品の豊富なエコシステムで分析とAIを迅速に実行すること」「洗練されたデータとAI製品を迅速に構築・配布・収益化すること」といったメリットをもたらすとしている。
例えば、社内のチームが共有する全てのデータプロダクトのディレクトリとして、インターナルマーケットプレイスの一般提供が開始された。これにより、他のチームや事業部門が提供する、利用可能なデータ、アプリ、AIプロダクトを素早く発見できるようになる。
また、Cortex Fine Tuned LLMモデルの重みをリージョン内のアカウント間で安全に共有する機能が現在、パブリックプレビューとして公開されている。ファインチューニングされたモデルを共有することで、生成AIのユースケースのコラボレーションと本番導入が容易になる。
加えて、開発者がデータ、アプリ、AI製品の配信コストをより管理しやすくするために、複数のクラウドリージョンにデータ製品を共有する際に発生する追加の送信コストを節減する新しいエグレスコストオプティマイザ(近日中に一般提供)が発表された。
具体的には、複数のクラウドリージョンにデータやアプリを共有するためにクロスクラウド自動複製(Cross-CloudAuto-Fulfillment )を使用する際に発生する追加のエグレスコストを削減する組織レベルを設定できる。
アプリの収益化という観点からは、Snowpark コンテナサービス(現在AWSで一般提供中、Microsoft Azureでパブリックプレビュー中)とSnowflake ネイティブアプリフレームワークとの統合を提供する。
これにより、アプリ提供者は任意のプログラミング言語でアプリを構築し、顧客のSnowflakeアカウント内で設定可能なGPUおよびCPUインスタンス上にデプロイすることが可能になる。
公開されたアプリは、エンド・ツー・エンドのアプリ開発プロセス全体にわたって可観測性とセキュリティが強化され、クラウドや各リージョンをまたいでシームレスに配信できる。
Genesis Computing、Kumo AI、LandingAI、RelationalAIなどの企業は、この統合機能を活用し、Snowflake マーケットプレイスを通じてSnowflakeのお客様にAI搭載アプリを提供して収益を得ているという。


