東芝は10月15日、「第15回東芝技術サロン」を開催。同社が提供するNoSQL DBMS(Database Management System)である「GridDB」の特徴や社会インフラ領域での活用事例のほか、同DBを活用したオープンイノベーション活動について紹介した。

【関連記事】
≪IoTやビッグデータ管理向けデータベース「GridDB」の機能強化版≫
≪ビッグデータ・IoT向けDB「GridDB」のSQLインターフェースを無償公開≫

GridDBは、東芝デジタルソリューションズが開発したビッグデータやIoTシステム向けに特化したDBMDSだ。同DBは2011年に開発がスタートし、2013年にリリースされた(当時の製品名はGridStore)。

開発の背景について、東芝デジタルソリューションズ ICTソリューション事業部 新規事業開発部 シニアエキスパートの望月進一郎氏は、「東芝が手掛ける社会インフラシステムを維持・管理していくためには、システムの稼働状況を記録し、活用するデータベースが必要だ。だが、NoSQL DBが登場した当時は、オープンソースで開発されたものが多く、信頼性に不安があった。そこで、社会インフラシステムに適したDBMSを開発することにした」と振り返った。

  • 東芝デジタルソリューションズ ICTソリューション事業部 新規事業開発部 シニアエキスパート 望月進一郎氏

GridDBの特徴については、「時系列データ指向」「ペタバイト級の高い処理能力」「高い信頼性と柔軟な拡張性」「開発の俊敏性と使いやすさ」が挙げられた。

GridDBでは、時間とともに変化する時系列データの処理に適したアーキテクチャが採用されている。具体的には、独自に開発した「キーコンテナ型」と呼ばれるデータモデルで、テーブルの形で収集されるIoTデータ向けに拡張した同モデルにより、高頻度で大規模な時系列データを効率よくリアルタイムに処理できる。

  • GridDBの時系列データ指向モデル、出所:東芝デジタルソリューションズ

また、「イベント駆動エンジン」や時系列データ配置技術TDPA(Time Series Data Placement Algorithm)を実装することで、排他処理や同期待ちの発生を起こさずにCPUをフル活用できるうえ、サーバのメモリを最大限活用することが可能なため、ペタバイト規模のデータもあつかえる。

スケールアウト型データベースでは、レプリケーション時のデータ配置のバランスが悪いと、特定のサーバに負荷が集中しパフォーマンスが低下する。GridDBでは、独自開発したADDA(自律データ再配置技術)を用いてインバランス状態を検知し、負荷が高いサーバから低いサーバへとデータの再配置を行うため、障害の発生時やサーバ増設においてもノンストップ運用を実現できる。

GridDBでは、NoSQLとSQLのデュアルインターフェイスを提供している。大量のデータ収集ではNoSQLを、データの分析や他システムとの連係ではSQLを利用できるので、高速・高スループットなデータの登録・検索・更新と複雑なデータ検索を、1つのDBで両立できる。

  • デュアルインターフェイスでリアルタイム分析が可能、出所:東芝デジタルソリューションズ

「あるHDD製造会社では、品質管理システムに高品質DB専用機を用いて、データ蓄積量が1.9PB/5年、登録データ量が267GB/日、分析用SQLによるアクセス頻度が約3万回/日という、製造レコードの全件取得を目指していたが、コスト面に課題を抱えていた。GridDBを用いて標準的なIAサーバでの管理に変えたことで大幅なコストダウンを実現できた」と望月氏。

また、半導体製造ラインのトレーサビリティと品質管理を行うシステムへの導入事例では、バラバラに構築されたデータベースからGridDBにデータを統合することで、DB検索の高速化を実現。製造履歴や品質履歴、材料データなどのデータの横断的な分析やリアルタイム分析も行えるようになった。

  • 半導体製造ラインでの活用事例、出所:東芝デジタルソリューションズ

このほか、同社はGridDBを活用したオープンイノベーションの推進にも力を入れる。2016年にGitHub上でソースコードを公開したことを皮切りに、OSS(オープンソースソフトウェア)ユーザーの拡大のためにデベロッパーサイトを運営し、技術ブログ、ハウツービデオ、ホワイトペーパーなどを日本語と英語で配信している。

同社新規事業開発部 スペシャリストのアンガ スヘルマン氏は、「デベロッパーサイト以外にもQiitaやMediumでデータ分析関連のブログなども投稿している。自社のリソースを応用するだけでなく、企業の垣根を越えてさまざまな開発者や利用者、パートナーとつながり、新しいアイデアや付加価値を創出するとともに、ビッグデータ分析技術を普及・促進したい」と語った。

  • 望月氏(左)と東芝デジタルソリューションズ新規事業開発部 スペシャリスト アンガ スヘルマン氏(右)

自社から発信するだけでなく、同社はGridDBのコミュニティ拡大とユーザーからのフィードバックの取り込みのため、Q&AプラットフォームのStackoverflowやSNSなどでユーザーと双方向のやり取りも展開している。

2021年4月から東芝デジタルソリューションズは、クラウド版となる「GridDB Cloud」を提供し始めたほか、スタートアップ企業のDATAFLUCTとの協業による店舗の来客数の予測を最適化する機械学習ソリューションを発表した。

望月氏は、「今後もオープンソース活動を通して、他社との連携を進めていき、GridDBのエコシステムを広げていきたい」とまとめた。