NTTおよびNTTデータは12月18日、オープンソース・ソフトウェア「Apache Hadoop」およびその関連のプロジェクトのコミッタに、小沢健史氏(NTTソフトウェアイノベーションセンタ)、鯵坂明氏、岩崎正剛氏(NTTデータ 基盤システム事業本部)の3名が就任することになったと発表した。
初めに、基盤システム事業本部 システム方式技術事業部 OSSプロフェッショナルサービスの濱野賢一朗氏が、Hadoopプロジェクトの概要、同社のHadoopへの取り組み、コミッタ就任の経緯などについて説明した。
Hadoopは、Apacheソフトウェア・ファンデーションが運営するオープンソースプロジェクトの1つとして開発が進められている並列分散処理を実現するオープンソースソフトウェア。大規模データを効率的に格納・処理できることから、ビッグデータ活用を支える基盤として普及が進んでいる。
Hadoppのメンテナンスや開発はコミュニティで行われており、コミュニティが選出したコミットのみがプログラムを書き換える権限(コミット権)を持つ。現在、コミッタは約100名、コントリビュータは約3000名いるという。コミュニティはPMCという組織が運営を担っており、コントリビュータの選出も行うという。
HadoopプロジェクトはHadoop本体に加え、その利活用に有用な周辺ソフトウェアも開発が行われているが、今回、鰺坂氏と小沢氏はHadoop本体のコミッタに、岩崎氏はHTraceのコミッタに就任した。
NTTデータでは2008年からHadoopについて取り組みを開始し、2010年に「Hadoop構築・運用ソリューション」としてHadoopを使ったシステムインテグレーションやサービスの提供を開始した。
濱野氏は、同社がHadoopの開発に取り組んでいる経緯について、「Hadoopを実際に使っていると、さまざまな課題に直面する。それらを解決するにあたり、使っているからこそ得られる知見が生まれるので、それを伝えたかった。今では、事象の報告にとどまらず、先を見据えた開発に参加している」と語った。
Hadoopのコア機能の開発に加え、バグの改修や利用者向けのドキュメントなどに貢献しているという。具体的な活動としては、「YARNの高可用正機能に向けた活動」「Sqoop PostgreSQLコネクタの開発」「HTraceの開発」などが紹介された。
Hadoopコミュニティへの貢献の度合いは「解決済みissueの数」や「貢献コードの行数」を指標に測ることができるが、2014年上半期において、同社はいずれも世界第4位につけているという。
鰺坂明氏は2011年入社で、「OfflineImage Viewerの拡張」「Hadoop 2のドキュメント整備」などに取り組んできた。小沢健史氏は2010年入社で、YARNの「高可用化」「処理基盤間のインタフェースの整備と実装」「致命的なバグ修正」などに取り組んできた。岩崎正剛氏は2002年入社で、HTraceの「モジュール開発」「トレーシング機能をHDFSに追加」などに取り組んできた。
濱野氏は、今後の活動目標について、「オープンソースのデータベースソフトであるPostgre SQLやMySQLがそのまま使えるクオリティであるのに対し、現在のHadoopは手を入れないと使えないと言われている。今後、単体で利用できるクオリティのものを提供していきたい」と説明した。