米Oracleが9月18日から21日にかけて開催した年次イベント「Oracle CloudWorld 2023」では、インフラ、アプリケーション、データベースと全てにおいて、生成AIに関連した発表が行われた(エリソンCTOが生成AIについて語った基調講演の模様はこちら)。
インフラ関連で注目すべき発表は「Oracle Cloud Infrastructure (OCI) Generative AI」であり、企業がLLMをアプリケーションに統合することを容易に可能にするという。
以下、OCI Generative AIについて発表した、Oracleでクラウドインフラストラクチャ担当エグゼクティブバイスプレジデントを務めるClay Magouyrk氏の基調講演の模様をお伝えする。
Reka、Mosaicなどの主要AI企業がOCIを利用
生成AIのブームについて、Magouyrk氏は、「生成AIは、2017年にGoogleが発表したTransformerモデル、GPUなどハードウェア側とネットワーキング技術の進化により成立したブーム」と分析してみせた。 OCIではハードウェアとネットワーキングを組み合わせた”スーパークラスタ”を構築、現在1万6000のGPUをサポートし、RDMAを利用することでGPU間の通信が20マイクロ秒以下で実現する。「スループットは毎秒400Gビット」とMagouyrk氏は胸を張る。
OCIはIaaSのシェアという点ではトップ3のAmazon Web Services(AWS)、Microsoft Azure、Google Cloud、そして中国Alibabaなどには及ばない。それでも、Magouyrk氏によるとReka、MosaicなどのAI企業が利用しているという。Mosaicでは、OCIを利用することで性能を50%改善し、80%のコスト節約を実現できているという。
企業が生成AIを活用する際の3つの課題
企業が生成AIを活用するにあたっては、アクセスコントロール、スキルや知識不足、統合といった課題がある。
アクセスにまつわる課題を解決するためにOracleが開発したのが、イベントで発表した「OCI Generative AI」だ。同社が出資するCohereとの提携を通じて開発したもので、API経由で利用できるマネージドサービスだ。文書作成、サマリ作成、チャットなどのユースケースに統合できる。「顧客は自社データを完全にコントロールし、何が使われたのかを理解できる」とMagouyrk氏。
OCI Generative AIはOCIの分散クラウドモデルで利用できる。現在、一部顧客向けのアーリーアクセス段階で、「もう間もなく」運用環境になるという。
スキルや知識不足の課題については、「チームが簡単にアクセスして、安全に色々と試すことができるようにする」ことが解決につながるとした。
統合の課題については、CohereのファウンデーションモデルとRAG(Retrieval-Augmented Generation)を組み合わせ、ワークロードに容易に統合できるようにした。
LLMアプリケーションとユーザー情報、在庫システムなどのバックエンドと接続することで、顧客の問題を対話形式で解決するデモが披露された。
顧客が製品がうまく使えないと報告すると、システムがナレッジベースから関連項目のリンクとともに回答を出す。顧客が問題を特定できると、必要な部品をどこで入手できるのかについて顧客の住所、在庫情報などをもとに、近くの店舗情報とオンラインの入手方法を紹介してみせた。
OCIの95%に電力効率に優れるNVIDIA Ampere採用
続いて、Magouyrk氏はOCIの戦略について語り、Oracleのクラウドへのアプローチの特徴を次のように語った。
「Oracleのクラウドへのアプローチは土台から異なる。バラバラのレイヤーを開発するのではなく、インフラ、業務アプリケーション、業界別アプリケーションを統合した単一のクラウドにする」
こうしたアプローチを実現するため、スタックの全てのレイヤーでOracleのアプリケーションの動作を再構築したという。これにより、実装、拡張、そしてガバナンスとコントロールなどでメリットが得られるとする。
なお昨今は、コンピューティングへの需要が高まる一方で、気候変動などの観点からデータセンターの消費電力が懸念材料となっている。
「世界には8000以上のデータセンターがあり、全電力消費の3%を占めている。この比率は。2030年までに8%に増加すると予測されている」(Magouyrk氏)
データセンターが排出するCO2は現在2%、これも2040年までに14%まで増加すると予測されているという。エネルギー価格の変動なども考慮しなければならない。
そこでOCIではこの分野に投資し、電力効率に優れるNVIDIA AmpereアーキテクチャをOCIサービスの95%、Fusionの全新規顧客で採用しているという。
会期中、NVIDIA H100 TensorコアGPU、 NVIDIA L40S GPU、AmpereOne CPUを搭載した新しい「Oracle Cloud Infrastructure(OCI) Compute」インスタンスを発表している。