オンラインゲームや動画配信などを行っているインターネットサービスの大手「DMM.com」が、サーバインフラの仮想化に伴いストレージを一新した。これまではベアメタルのサーバをそれぞれのビジネス部門が調達して運用を行っていたが、インフラの刷新に伴い、XenやKVMからVMwareによる仮想化に刷新。さらに、仮想化専用のストレージアレイであるTintri(ティントリ)のハイブリッドストレージを導入し、これまで手間のかかっていたストレージの運用管理を省力化した。既に導入から一年間ほど経っているが目立ったトラブルもなく、順調にDMMのインフラを支えているという。

今回は、DMM.comラボのインフラ統括本部 XaaS部 エンジニアである高橋尚史氏にインフラ刷新の背景や経緯を聞いた。

DMM.comラボ インフラ統括本部 XaaS部 エンジニア 高橋尚史氏

--まず、インフラを刷新する背景をお聞きしたいのですが。

DMMでは動画配信やソーシャルゲームの配信などのコア事業を行っていますが、それぞれのビジネスで必要なサーバなどは個別に購入していました。それをインフラチームで運用管理していたのですが、2014年の秋ごろから「このままでは管理できなくなるかもしれない」ということで、ベアメタルサーバを仮想化基盤に載せていこうということになりました。

--VMwareにする以前はKVMを使っていたんですか?

そうです。実際にはシトリックスのXenServerやKVMなどが使われていました。ただ、使いやすい管理ツールがなく、コマンドラインで運用しなければいけないなど管理面で不安がありました。その点、VMwareであればvCenterもあり、そういう部分での不安はありませんでした。

--プライベートクラウドというとOpenStackという選択肢もあると思うのですが。

はい、今流行のOpenStackでやります!といいたいところですが、我々の規模からするとちょっと時期尚早かなという感じです。現在は、仮想マシンが1000台程度の規模で、この夏以降にこれを倍増させる計画ですが、それでも2000VM程度ですから。OpenStackも進化が速いのでついていくのは大変ですね。

--サーバ側はVMwareで統一したとして、ストレージはどのように選択したのですか?

当時、担当者は私ひとりだけで、まず調査から始めました。たまたま東京都内でVMwareのイベント、vForum 2015 TOKYOが開催されていたので、それに参加してTintriの仮想化専用ストレージというコンセプトに惹かれて話を聞いたのが、Tintri採用のきっかけです。それからTintriのSEやリセラーの方に話を聞いたり、実証実験のために貸出機をお借りして負荷テストなどの評価を行いながら、2015年の年明けにはもうTintriでいこうということになりました。

--他のストレーシベンダーも検討されたのですか?

実は動画配信の部門はGlusterFSの大きなクラスターがあったり、他のストレージベンダーの製品が入っていたりしたので、Tintri以外のストレージも検討しました。ストレージに経験と実績がある大手ベンダーからも提案を受けましたし、上層部からは「よく名が通ったベンダーではダメなのか?」みたいな話もありました。Tintriはそもそも名前が知られていなかったので。

ーーでは、Tintriを選択した大きな要因は何ですか?

そもそも仮想化基盤に移行しようという時期だったので、やはり、仮想化専用ストレージというキーワードに惹かれました。他のベンダーの提案も聞いてみたのですが、ストレージ専業ベンダーなので、どんな構成もできます、変更はこうすれば可能です、といった話が多かったです。ただ、実際に私たちが求めていたのは、とにかく手間がかからないこと、システムを入れたらそのまま面倒なことはしなくても動いて欲しい、ということが最優先だったんです。細かくチューニングができますというのが欲しかったわけではありません。例えば、VMwareにもVVOLやVSANがありましたが、それだとハードウェアを別に調達しないといけないんです。そのため、ハードとソフトを一緒に簡単に運用したいというニーズからは外れていました。価格的にもこちらの要望とはずれていました。

--実際にシステムが決定されて導入~運用のフェーズに入っているわけですが、特に問題はありませんか?

これが本当に問題なく動いているので、ちょっと驚いているんです。約1年間使っていますが、その間、1台だけHDDが壊れたことがありました。それぐらいですかね。あとファームウェアのアップデートがあり、一瞬システムを止めないといけないことがありましたが、それもなんとか乗り切りました。思ったよりもフェイルオーバーするのに時間がかかってしまって、少しあせりましたが。

--実際に運用してみて、何か発見はありましたか?

Tintriの管理ツールで、そのVMがどれだけのCPUやメモリーを使っているのか、IOPSはどれくらいなのかが可視化されますが、Tintirのハードウェアに装備されているSSDのキャッシュもほぼ100%で、実はそれほどストレージに対する負荷が高くなかったということがわかりました。他にはハードウェアの構成がシンプルなのでラックのスイッチからの配線がシンプルなことが良かったと思います。

--今後の計画について教えてください。

現在は、まだインフラチームがリクエストを受けて仮想マシンを作ったり、ストレージを割り当てたりしていますが、将来的にはセルフサービス化してポータルを社内に公開して、エンジニアが自分でサーバやストレージを使えるような姿を目指しています。

また、今後は、夏以降に今のシステムと同じものを入れて規模を倍増しようと思っています。さらに次期システムでは、ハイブリッドだけではなくてオールフラッシュも視野に入れています。現在は社内のユーザーにSLAを使ってリソースを提供しているわけではないのですが、、将来的にはより速いストレージが必要な場合はフラッシュで、中間を今のハイブリッドで、もっと遅くても問題が無いものは価格的に安いものを、という風にグレードを分けてリソースを使えるといいなと思っています。この辺りもこれから検討を進めるところです。

Tintriのストレージは問題が無さ過ぎるという高橋氏だが、とにかくシンプルで運用が簡単なシステムが欲しいというゴールを達成して満足ということだろう。次のシステム増強に向けて着々と準備が進むDMM.comだが、運用管理の工数を増やさずに多数の仮想マシンを運用できる仮想化専用ストレージの効果を見ることができる事例であった。