この連載はIT業界における経験がまだ浅い方、あるいはIT業界は長くともこれまでの業務においてストレージとは無縁だった ― けれど、何らかのきっかけで「ストレージ」について知らなくてはならなくなった方、などを対象に「ストレージ」の仕組みや用語などについて知っていただくことを目的としています。

知っておいて損はない「ストレージ」の世界に、あなたも少しだけ足を踏み入れてみませんか?

知っていますか、「ストレージ」

さて、初回となる今回は「ストレージ」とは何か、という根本的な命題についてお伝えします。

世界はデータで溢れている ― 多くの方は毎日スマートフォンやPCから様々なサービスを利用されているものと思います。例えば Instagram や Twitter などですね。

それらのサービスで使われる写真やツイートなども「データ」ですし、ユーザーがサービスを利用した履歴や何でアクセスしているか、などの情報も「データ」、はたまた工場の機械に着いているセンサーなどが出力する情報も「データ」です。ことほど左様に、世界中には様々なデータが存在しますが、その総量がどれくらいになるか想像がつきますか?

調査会社IDCによれば (*1) 、2018年度で33ゼタバイト、今から6年後の2025年にはなんと175ゼタバイト (*2) まで増加すると予想されています。

(*1) IDC White Paper, sponsored by Seagate, Data Age 2025: The Digitization of the World from Edge to Core, November 2018

(*2) ゼタバイト(ZB):データ容量を示す単位の1つ。1ゼタバイトは1兆ギガバイト。

図1:Annual Size of the Global Datasphere

日本国内で最もよく使用されているスマートフォンであるiPhoneには2019年現在、最大で512ギガバイト(GB)容量のモデルがありますが、175ゼタバイト(ZB)はその最大容量モデルの約3418億台分の容量です。想像もつかない容量ですね!

ちなみに幅70.9mmのiPhone XSを3418億台、横方向にすき間の無いようぎちぎちに詰めて並べると・・・なんとその幅は約1.62天文単位 (*3) になってしまいます。火星が太陽から最も遠い位置にある時 (*4) で1.67天文単位なので「太陽と火星が最も遠い時」といい勝負・・・ここまでいくと数が大きすぎてよくわかりませんね(苦笑)。

(*3)天文単位:主に天文学で用いられる長さの単位。1天文単位は149,597,870,700 mで、地球と太陽の距離とほぼ同じ長さ。

では、一体その膨大な量のデータはどこに記録、保管されているのでしょうか? 一般の方であればそれを気にする必要はないのかもしれません。しかし、IT業界に身を置くあなたにはぜひ知っておいていただきたいのです。さまざまなデータを記録、保管し ― 保管されたデータを使用する時は瞬時に必要なデータを読み出す ― そんな縁の下の力持ち、「ストレージ」のことを。

普段はその存在を気にしませんが、確実にそこに存在する「(IT)インフラ」。その中でもさらに地味な「ストレージ」ですが、これはこれで奥深い世界があるのです・・・。

「ストレージ」、て何?

さて、それではまず最初に「ストレージ」とは何か、について触れます。

広い意味での「ストレージ」はデータを通電しない状態でも長期間に渡って安定的に格納し、必要に応じて適切に取り出せるように設計、製作されたデバイスすべてを指します。IPAが主催する基本情報技術者試験を受験された方であれば「二次記憶装置」「外部記憶装置」などとも呼ばれていることをご存じかもしれません。

身近なものではスマートフォンに内蔵されたフラッシュメモリやmicroSDカードなども「ストレージ」にあたります。他方、データセンターの中にずらりと並んだ巨大な装置群の中にも「ストレージ」と呼ばれる機器があります。

この連載では基本的に企業内で利用される「ストレージ」について取り扱います。具体的にはHDDやSSDのような「記憶メディア」と、それらを集めて大きな容量、速度、接続性で使用できるように構成された「ストレージ装置」そのもの、およびサーバーとストレージ間を接続するネットワークなどから構成される「企業向けストレージ環境」に関連した技術にフォーカスして紹介していきます。

「企業向けストレージ環境」を構成する要素について

今回は、「企業向けストレージ環境」を構成する要素について大まかに紹介します。

初回なので概要を記載するのに留め、詳細については連載の中で順次紹介していきます。

「サーバー群」

通常企業向けストレージは複数台のサーバーを接続して使用します。近年ではサーバーの多くは仮想化されていますが、UNIX系のサーバーや一部のデータベースサーバーなど物理サーバーが使用されているケースもあります。サーバーはストレージに対してデータを出力し、また必要に応じてストレージ上のデータを読み出して使用します。サーバーがなければストレージ上に格納されたデータが使用されることはありませんので、サーバーあってのストレージと言えるかもしれません。

「ストレージ・エリア・ネットワーク」

サーバー群とストレージ間の接続は通常何らかのスイッチを介してネットワーク化されています。ストレージデータのやりとりに特化したネットワークを特に「ストレージ・エリア・ネットワーク ― SAN」と呼びます。現在使用される SAN は大きく分けて汎用的な Ethernet を使用するものと、ストレージ専用の Fibre Channel ― FC を使用するものの二種類があります。

「ストレージ装置」

「ストレージ装置」は、大量のデータをユーザーの求めに応じて格納し、また必要に応じて取り出せるような意図を持って作成された機械装置です。「ストレージアレイ」と呼称することもあります。

構成するコンポーネントを大別するとデータの入出力をつかさどるコンポーネントを搭載する「(ストレージ)コントローラー」と、データを実際に格納するコンポーネント(記録メディア)を搭載する「(ディスク)シェルフ」に分けることができます。

「ストレージコントローラー」

「ストレージコントローラー」はデータを入出力するための各種インターフェース、入出力を制御するプロセッサーとメモリ、および専用のソフトウェアで構成される「データ入出力専用に特化したコンピューター」です。より細かくは図中にあるようにサーバーとの入出力を捌く「フロントエンド」とデータを記憶メディアに保管、あるいは記憶メディアから呼び出すための入出力を捌く「バックエンド」、その中間にある「キャッシュ」などの要素に分かれます。

なおこのコンポーネント、正しくは「ストレージコントローラー」ですが、ストレージ装置の話をしている時は単に「コントローラー」と呼ぶことが多いようです。

「ディスクシェルフ」

一般に「シェルフ」といえばオープンな棚のことを指しますが、ストレージの世界ではHDDやSSDなどデータを格納するための記録メディアを大量に搭載するための「箱」を指します。大量に搭載された記録メディアはコントローラーと接続され、コントローラーの制御によってデータを格納したり読み出したりするのに使用されます。

「ストレージコントローラー」と同様、ストレージ業界では単に「シェルフ」と呼称するか、あるいは同じ意味合いで「エンクロージャー」という呼称を用いることもあります。

まとめ

今回取り扱った内容は以下の通りです。

・世界中で生成、使用されるデータ量は年々凄い勢いで増加中

・増加するデータを格納しているのが「ストレージ装置」

・「ストレージ装置」は「企業向けストレージ環境」を構成するコンポーネントの一部

・「ストレージ装置」はさらに「ストレージコントローラー」「ディスクシェルフ」などから構成されている

・「企業向けストレージ環境」は「サーバー群」「SAN」「ストレージ装置」などで構成されている

いかがでしたでしょうか。初回なので概論的な話が多く、また用語の説明がほとんどになってしまいました。今回触れた用語は「企業向けストレージ環境ではそんな言葉を使うんだね」くらいに、頭の片隅に留めておいていただければ結構です。内容については連載の中で順次説明していきます。

次回はストレージ装置を構成する「ストレージコントローラー」と「ディスクシェルフ」、そしてそれぞれを構成するもう一段細かいコンポーネントについて紹介する予定です。

それではまた次回、地味でディープなストレージの世界でお目にかかりましょう。