Amazon Web Services(以下、AWS)は11月28日から12月2日まで(米国時間)、同社最大のカンファレンス「AWS re:Invent 2022」を開催した。その基調講演において、Amazon Web Servicesでデータおよび機械学習担当バイスプレジデントを務めるSwami Sivasubramanian氏が機械学習に関する数々の新機能を発表した。本稿では、それらの詳細をお届けする。
膨大なデータに苦戦する企業、解決のカギは機械学習
企業が直面している問題の一つに、膨れ上がるデータをどのように分析するか、どのように活用するのか、といったことがある。事業を通じて大量のデータが蓄積されていくが、このデータから次のアクションや改善案、分析結果を得ることができなければ、質の高いサービスを提供することは難しい。
こうしたケースに対応する方法の一つが人工知能(AI: Artificial Intelligence)の活用であり、機械学習(ML: Machine learning)の活用だ。あらかじめデータを用いて学習を行わせておき、収集されるデータから迅速に次のアクションが得られるようにする。またはそこからさらに学習を改善させていく。大規模データ処理と機械学習は切っても切れない関係になりつつある。
企業が必要とする機械学習関連の機能は業務に依存しており、多種多様だ。AWSの強みは、企業が必要とする機械学習に関するさまざまなサービスをすでに提供している点にある。既存のこうしたサービスを組み合わせることで、企業が求める機械学習プラットフォームおよびサービスを構築することができる。
新たに発表された機械学習関連の機能
Sivasubramanian氏が11月30日(米国時間)の基調講演で発表した主な新サービスは次のとおりだ。ご覧の通り、かなりの数の機械学習関連の新サービスや新機能が発表された。
- Amazon Athena for Apache Spark
- Amazon Redshift Integration for Apache Spark (先日発表済み)
- Amazon DocumentDB Elastic Clusters
- Amazon SafeMaker supports Geospatial ML (preview)
- Amazon Redshift Multi-AZ
- Trusted Language Extensions for PostgreSQL
- Amazon GuardDuty RDS Protection (preview)
- AWS Glue Data Quality
- Centralized Access Controls for Redshift Data Sharing (preview)
- new ML governance tools for Amazon SageMaker
- Amazon Aurora zero-ETL integration with Amazon Redshift (先日発表済み)
- Amazon Redshift auto-copy from S3
- Amazon AppFlow now offers 50+ connectors
- Access 40+ new data sources from Amazon SageMaker Data Wrangler
- AWS Machine Learning University now provides educator training
機械学習関連の新機能のリンク
各機能の詳細は、以下のページからたどることができる。
- Amazon Athena now supports Apache Spark
- AWS announces Amazon Redshift integration for Apache Spark
- Amazon DocumentDB (with MongoDB compatibility) Elastic Clusters is now generally available
- Amazon SageMaker now supports geospatial ML (preview)
- Amazon Redshift now supports Multi-AZ (Preview) for RA3 clusters
- Announcing Trusted Language Extensions for PostgreSQL on Amazon Aurora and Amazon RDS
- Amazon GuardDuty RDS Protection now in preview
- AWS Glue announces AWS Glue Data Quality (Preview)
- Amazon Redshift data sharing now supports centralized access control with AWS Lake formation (Preview)
- Introducing new ML governance tools for Amazon SageMaker
- AWS announces Amazon Aurora zero-ETL integration with Amazon Redshift
- Amazon Redshift now supports auto-copy from Amazon S3
- Amazon AppFlow now supports over 50 Connectors
- Amazon SageMaker Data Wrangler now supports over 40 third-party applications as data sources
- AWS Machine Learning University announces educator enablement program for higher education