2016年7月7日(現地時間)、Microsoftはクラウドスケールアプリを簡単に管理・展開するJava向けAzureツールでHDInsightをサポートしたことを公式ブログで発表した。ソースコードなどはMITライセンス下でGitHubに公開済み。エンジニアはJavaベースのIDE(統合開発環境)であるEclipseを通じて、Apache SparkやScalaやJavaでの開発が容易になる。

Eclipseの<Help>メニュー→<Install New Software>から、「http://dl.microsoft.com/eclipse」を指定し、<Azure Tool for Java>を選択。その後、HDInsight Spark clusterからSpark Scalaプロジェクトのセットアップなどを行う(公式ブログより抜粋)

「HDInsight Tool for Eclipse」は、Sparkプロジェクト作成時のテンプレートやサンプルコード、自動生成機能を備え、Eclipse(主にScalaとJava)によるネイティブオーサリングサポートと、Spark開発用アプリケーションを搭載。作成したSparkアプリケーションはHDInsight clusterにサブミットし、実行中のSparkアプリケーションの停止やテスト、Spark clusterの表示などといった機能を備える。

「HDInsight上でSparkアプリケーションを開発するビッグデータエンジニアは、最初のアプリケーション構築で手間取ることが多いが、本ツールを使えば数分で開発を始められる」と、Microsoft Big Data Team プリンシプルプログラムマネージャーのJenny Jiang氏は、「HDInsight Tool for Eclipse」をアピールした。なお、こちらが具体的なインストール手順を解説するドキュメント動画を参照できる。

阿久津良和(Cactus)