機械学習を活用したデータ分析の基盤として、Linuxは人気のあるプラットフォームの一つである。今日では、WLS(Windows Subsystem for Linux)を使えば、Windowsユーザーでも簡単にLinux環境を利用することができる。これは、Windows上でもLinuxを活用したデータサイエンスのための環境を構築できることを意味している。

Ubuntuの開発元であるCanonicalは12月10日、「Ubuntu Blog」において、WSLを使ってWindows上にデータサイエンティスト用の作業環境を構築する方法を紹介した。

この記事のゴールは、NVidia GPUを搭載したPCに新しいWindows 10をインストールしてから、次のような作業環境を実現することだ。

  • 実現したいデータサイエンティストのための作業環境

    実現したいデータサイエンティストのための作業環境

作業は大きく分けて次の4つのステップになる。

・ステップ1: WSLをインストールする
・ステップ2: Ubuntuをインストールする
・ステップ3: GPUドライバーとDockerをインストールする
・ステップ4: NVIDIA Data Science Stackをインストールする

ステップ1はPowerShellのコマンドで、ステップ2はMicrosoftストアから簡単に実行できる。ステップ3のGPUドライバーのインストールだが、WSLではWindows上のドライバーが利用されるため、Windows用のドライバーをインストールすればよい。DockerはUbuntu上にインストールする。

一番のポイントはステップ4だろう。NVIDIA Data Science StackはGPUに対応したデータサイエンスのソフトウェアスタックを簡単に構築・管理することができるオープンソースのツールである。GPUを利用するデータサイエンスのためのツール群を含んだコンテナをコマンドひとつで構築することが可能になる。NVIDIA Data Science StackがGitHubで公開されており、git cloneすることで入手できる。

以上、たった4ステップでデータサイエンティストのための作業環境の構築は完了だ。手元にNVidia GPUを搭載したPCがある方は、ぜひ試してみるといいだろう。