データビークルは1月29日、電通、アプレッソ、takram design engineeringと共同開発したデータサイエンス専用変換ツール「Data Ferry」(データフェリー)を5月9日より発売すると発表した。
初めに、代表取締役 CEOを務める油野達也氏が新製品を開発した経緯を説明した。
油野氏によると、データ分析がうまくいかない原因はデータの切り分け方にあり、データ切り分けにおける課題を解決する製品として、同社が昨年7月に発表したのがデータ分析ソフト「Data Diver」だ。
「データ分析は、収集・分析・行動といったステップを踏む。データの切り分けがよくないパターンは2つあり、1つはIT部門が収集と分析を行い、現場が行動を行っているパターン、もう1つはIT部門が収集を行い、分析を外部のデータサイエンティストが行い、現場が行動を行っているパターン。前者の場合、現場がどのように行動するべきかわからなくなっており、後者の場合、データサイエンティストはお金と時間がかかる割には、業務についてわかっていないという問題が生じている」
そこで、「Data Diver」はプログラミングの知識がなくても高度な統計技術を利用できるようにすることで、現場が分析まで踏み込めるようにした。
ただし、「Data Diver」を展開する中で、「データ連携ソフトが高い」「データをタイミングよく入手できない」といったデータ連携やデータ整備における課題が見えてきたという。こうした課題を解決するため開発されたのが「Data Ferry」だ。
油野氏には、データ分析を行うデータサイエンティストには専用機が必要であると考え、「素性のよいエンジン」を探していたところ、アプレッソに行き着いたと語った。「『高度な改善要求に耐えられる製品を持っていること』『共に戦えるエンジニアがいること』『海外で実績を持つファクトリー体制があること』という要素がそろっているエンジンを探していたが、正にアプレッソがそうだった」(油野氏)
「Data Ferry」にエンジンを提供するアプレッソの代表取締役社長を務める小野和俊氏も説明会に登壇した。小野氏は代表取締役社長という立場ながら、根っからの"技術者"ということで、今でもアプレッソの製品のエンジニアリングに関わっているという。
小野氏は、油野氏が挙げた「素性のよいエンジン」の条件を引き合いに出し、同社の技術力の高さをアピールした。
「これまで、各所からコンサルティングも提供してはどうかとの声もいただいてきたが、一貫してプロダクトの開発に注力してきた。また、ビッグデータの分析に対するニーズの高まりなどを踏まえ、大量のデータを高速処理できる機構も独自で開発しているほか、Javaエンジニアも多数そろっており、技術力には自信がある。また、エンジニアについても、新規の戦略アライアンスなどに対応できる開発体制を構築しており、開発生産性を最大化するための環境への投資も積極的に行っている。製品のグローバルかも着実に進めており、販売に加え、シンガポールに開発拠点を設けたり、英語・中国語でサポートを提供したりするなど、力を入れている」
「Data Ferry」の機能については、製品企画担当の藤田大地氏が説明を行った。
藤田氏は、「Data Ferry」のコンセプトについて、「分析に特化したツールであり、基本となるEAIは安定した国産エンジンを搭載している。ターゲットはIT部門以外としているため、設定はすべて自然言語で行える思い通りに、ユーザー自身がデータを加工できるような仕組みを用意している」と語った。
「Data Ferry」の技術面におけるキモは専用ストレージ「Analytical Source Lake」だ。各種データソースを統一されたデータセットに変換し、分析可能な形で醸成・蓄積することができる。Analytical Source Lakeに蓄積されたデータについて集計、テーブル統合、サンプリング、クレンジングが行われる。
加えて、藤田氏は「Data Ferry」の特徴として「完全なプログラムレス」「データベース内蔵」「分析に関する処理をすべて自動化」「オンプレミスとクラウドを双方向で接続」「データのマスキングによるセキュリティ対策」を挙げた。
「Data Ferry」はクラウドサービスとして提供され、利用料は月額40万円から(1ユーザーID、初期データ容量は1TBまで)。オンプレミスの販売については、国内のSIベンダーと協業を進めているところだという。