アマゾン ウェブ サービス ジャパン(AWS ジャパン)はこのほど、生成系AI(Generative AI)に関する勉強会を開催した。勉強会では、「生成系AIとはどういうものか」「生成系AIの背後にはどのような技術があるのか」「4月に発表されたAmazon Bedrockとは何か」について説明が行われた。
マイクロソフトやGoogleなど、さまざまなITベンダーが生成系AIの開発に取り組んでいるが、AWSはどのようなスタンスで生成系AIに臨んでおり、同社が提供している生成系AIサービスで何ができるのだろうか。
生成系AIを理解するカギは基盤モデル
技術統括本部 技術推進グループ 本部長 小林正人氏は、AIの体系において生成系AIが深層学習の一種の位置づけにあることを示し、「注目を集めているが、われわれはAIの一分野として捉えている」と述べた。
生成系AIとは「テラバイト規模のデータで学習させた数十億規模のパラメータを持つ 基盤モデルにより、追加学習なしに高精度の生成を実現する技術」と定義される。
小林氏は、「生成系AIは人のイマジネーションをこれまでにない手軽さで広げていくことができる点などから注目されている。基盤モデルによって実現されていることを理解しているとわかりやすい」と説明した。
基盤モデルを使うと何が便利なのか?
では、基盤モデルとはどのようなものなのだろうか。機械学習はシンプルな入力に対し、シンプルな出力を行う。また、深層学習は複雑な入力に対し、シンプルな出力を行う。しかし、基盤モデルを介すと、複雑な入力に対し、複雑な出力が可能になる。
小林氏は基盤モデルと機械学習モデルを比較してみせた。基盤モデルの最大の特徴は「一定の汎用性」だという。機械学習モデルは教師有データによって学習を行い用途に合わせて個別に作っていく。そのため、データの事前準備に手間がかかる。対する基盤モデルは、教師なしデータによって学習を行い、さまざまな用途に利用できる。
基盤モデルは出力内容に応じて、「Text to text」「Text to embeddings」「Multi modal」の3つに分類できる。小林氏は、現時点でビジネスの活用を考えると、簡単な自然言語プロンプト質問や指示を基に、それに応じたテキストを生成する「Text to text」が使われることになると述べた。
ビジネス利用のための基盤モデルが「大規模言語モデル (LLM:Large Language Models)」となる。基盤モデルのライセンスはオープンソースとプロプライエタリに分類できる。Amazon Titan Text、OpenAI GPT-4、Google PaLM 2はすべてプロプライエタリライセンスで提供されている。
そして小林氏は、AIサービスと基盤モデルが異なることに注意すべきと述べた。一部のプロプライエタリな基盤モデルは、付加価値・機能を追加した「AIサービス」としてのみ提供されることがあり、基盤モデルをユーザーが触ることはめったにないという。
また、基盤モデルの活用のためのテクニックとしては、「Fine-Tuning (事後学習)」と「プロンプトエンジニアリング」がある。前者の場合、自分たちに適したモデルを作るため、機械学習の知識が必要で、コストもかかるという。後者はわかりやすい方法だが、聞き方を工夫して出力をコントロールするなどの工夫が必要となる。
AWSの生成系AI関連サービスのラインアップ
こうした基盤モデルを利用するにあたっては、「基盤モデルの能力とコスト」と 「生成系AIで実現したいこと」を鑑みて、サービスを選ぶことになる。
小林氏は、生成系AIサービスを利用するスタンスを「モデルプロバイダー」「モデルチューナー」「モデルコンシューマー」の3種類に分類した。
AWSは、この3つのスタンスに合わせて、生成系AIに関連したサービスを提供している。「AmazonSageMaker/SageMaker JumpStart」は3つのスタンスをすべてカバーしており、「Amazon Bedrock」はモデルチューナーとモデルコンシューマーをカバーしている。
「Amazon Bedrock」は今年4月に、Limited Previewとして公開された「Amazon Bedrock」について説明した。同サービスは、生成系AIアプリ開発者向けに、基盤モデルの実行とFine-Tuning環境をサーバーレスで提供する。
「Amazon Bedrock」では、複数の基盤モデルから用途に最適なものを選択できる。また、自社データの公開することなく用いて、基盤モデルを安全にカスタマイズできる。
ちなみに、AWSは基盤モデルとして、自然言語処理に特化した「Titan Text」とエンタープライズ検索やパーソナライゼーションに適した「Titan Embeddings」を提供している。いずれも不適切・有害なコンテンツを制限することで、生成系AIの責任ある利用をサポートしている。
一方、「Amazon SageMaker JumpStart」では、選んだ基盤モデルと自社アプリを組み合わせて、生成系AIアプリとして統合できる。「Amazon Bedrock」よりも利用できる基盤モデルが多く、機械学習ライフサイクル全般を支える基幹サービスの位置づけにある。
小林氏は、機械学習専用のアクセラレータを搭載したEC2のインスタンスも紹介した。Amazon EC2 Inf1に加えて、Amazon EC2 Trn1nとAmazon EC2 Inf2 インスタンスの提供が開始された。
Amazon EC2 Trn1nは大規模言語モデルや拡散モデルのトレーニングをコスト効率が高い状態かつ高性能で実行できる。Amazon EC2 Inf2は、大規模言語モデルや拡散モデルの推論を高性能かつ低コストで実行できる。