NVIDIAは9月8日、デジタルスキル育成プログラム「DLI(Deep Learning Institute)」より、「DLI データサイエンス教育キット」の日本語版の提供を開始したことを発表した。このキットは日本のデータサイエンス教育の普及を目的としており、滋賀大学と共同で翻訳を進めたとのこと。教育機関に所属する教員は無償でダウンロード可能。

DLI データサイエンス教育キットの英語版は、ジョージア工科大学およびプレイリー ビュー A&M 大学の研究チームがNVIDIAと共同開発した。キット内容には、講義用のスライドや演習課題、DLI オンライン トレーニングへのアクセス権、クラウドの GPU インスタンスのクレジットなどを含む。

この教材ではデータサイエンスのさまざまな領域の基礎と応用の学習が可能だとしており、データ収集、前処理、NVIDIA RAPIDSによるアクセラレーテッド データサイエンス、分散されたコンピューティング、機械学習やデータ ビジュアライゼーションとグラフ解析の分野などを学べるという。また、公平性やデータバイアス、マイノリティなど文化的な責任に関するトピックも含んでおり、講義用スライドは1000ページを超えるようだ。

キットに含まれる主な学習内容は以下の通り。
・データサイエンスと RAPIDS の入門
・データ収集と前処理(ETL)
・データセットにおけるデータ倫理とバイアス
・データ統合と分析
・データビジュアライゼーション
・Hadoop、Hive、Spark と HBase によるスケールと分散コンピューティング
・機械学習(分類)
・機械学習(クラスタリング、次元削減)
・ニューラルネットワーク