富士通は12月5日、COBOLバッチアプリケーションをApache Hadoopで並列分散処理し、バッチ処理時間を大幅に短縮する機能を追加したCOBOL開発・運用ソフトウェア「NetCOBOL V10.5」を販売すると発表した。

同社によると、この製品はHadoopとの連携を実現した世界初のCOBOL開発・運用ソフトウェアで、「NetCOBOL」で開発したバッチアプリケーションや他社のCOBOLで開発されたバッチアプリケーションを、再コンパイルによりHadoopで並列分散処理できるため、顧客は既存のCOBOLデータやアプリケーションに手を加えることなく、バッチ処理時間を大幅に短縮できるという。

同技術は、HadoopのフレームワークであるMapReduceとCOBOLのデータ形式の違いを、富士通独自のデータ変換機能により吸収するため、COBOLのデータをMapReduceの入出力データとして利用できる。

また、Hadoopの基本は1つのファイルを使用する方式であり、COBOLバッチアプリケーションの複数ファイルを使用する方式と異なる。この違いを、複数入力変換機能により吸収するため、複数ファイルを使用するバッチアプリケーションでもHadoopを使えるようになる。データ変換機能や複数入力変換機能など同社独自のスマートソフトウェアテクノロジーにより、COBOLのデータとアプリケーションに手を入れずに、再コンパイルのみでHadoopを適用できる。

さらに、同社の「Interstage Big Data Parallel Processing Server」と組み合わせると、独自の分散ファイルシステムにより格納したデータに直接アクセスでき、Apache Hadoopでは必要な入出力のデータ転送が不要となり、さらに処理時間を短縮できる。

マスタデータとトランザクションログなど、複数ファイルを入力してソート・マージ処理し、複数ファイルを出力するバッチアプリケーションで、特に適用効果を発揮し、例えば、128GBのデータを16多重で集計した場合の処理時間は、本製品と「Interstage Big Data Parallel Processing Server」の活用で従来のバッチ処理の約18分の1に大幅に短縮し、本製品とApache Hadoopの活用でも約3分の1に短縮する。

複数入力変換機能(富士通研究所 特許出願中)処理能力比較

本製品は、日本のほか、北米を中心にグローバル約60カ国で利用され、オンプレミスでの利用に加え、富士通のパブリッククラウドサービス「FGCP/S5」、アマゾンウェブサービス「Amazon EC2」と「Amazon EMR」でも動作を確認しており、各クラウド基盤上にインストールして利用することができる。「FGCP/S5」、「Amazon EC2」、「Amazon EMR」のいずれも、Apache Hadoopとの組み合わせで利用できる。

なお、「FGCP/S5」では、月額のオプションサービスとしても提供するため、まずはクラウド環境で試行したり、スモールスタートでの運用が可能となる。

製品の販売価格は、および出荷時期は次のとおり。

製品の販売価格、および出荷時期