[2ページ] : 社内評判は秋の正式ローンチ前でも「とても良い」
[3ページ] : 数百TBデータを取り扱う時が懸念するポイント
日本で「インターネットの入り口」と言えば、ヤフーをイメージする人が多いだろう。メールやオークションなど100以上の多彩なサービスを展開しており、Yahoo! JAPAN IDのMAU(Monthly Active User)は4000万人を数える。同社は現在、これらのサービスを下支えするインフラ環境をシフトさせている。
ログ基盤サービスを提供するSplunkはこの6月に「SplunkLive! Tokyo」を開催。ヤフー システム統括本部 プラットフォーム開発本部長の服部 典弘氏が、インフラ環境の変化にともなうSplunk導入の経緯や今後の展望などについて語った。その模様と登壇後のインタビューをあわせてお伝えする。
データ量が1日50TB増加、延々と溜まり続けるログデータ
MAUは4000万人のヤフーだが、ログインせずに利用するユーザーを合計すると月間利用者は6000万人に達しており、月間の総ページビューは631億以上にのぼるという。これらを支える基盤としてヤフーは、日本4箇所、北米1箇所に自らデータセンター(物理マシンが6万台以上、仮想マシンのインスタンス数は8万以上)を構えている。
ストレージを見れば、データは1日50~60TB増加し、ストレージとして37ペタバイトを保有していると服部氏は話す。その多くがログデータであり、ユーザーがYahoo! JAPANにアクセスする際に発生したデータとなる。膨大なトラフィックを支える環境としては、LinuxやApache、Hadoopといったオープンソース技術をベースに、独自チューニングを加えて開発基盤を作っているという。
ログの収集・管理方法を見直す背景には、インフラ環境の変化がある。ヤフーは「OpenStack」と「KVM」をベースにプライベートクラウド環境を用意し、100以上のサービスにプライベートなIaaSを提供していた。だが、PaaSの「Cloud Foundry」やコンテナクラスタ技術「Kubernetes」といった新しい技術が登場しており、開発者がインフラ運用する必要がない環境を構築できる。
社内でも2013年頃を起点に、こうした技術の利用が広まっており、「サービス開発者の負担を下げ、できるだけ中央に共通基盤を集めることで、運用負荷を下げたり、メンテナンスコストを下げる意図があった」(服部氏)。
[2ページ] : 社内評判は秋の正式ローンチ前でも「とても良い」
[3ページ] : 数百TBデータを取り扱う時が懸念するポイント
※ 本記事は掲載時点の情報であり、最新のものとは異なる場合がございます。予めご了承ください。
もっと知りたい!こちらもオススメ

スポーツの代表チームは、どんなデータを分析しているのか - Watson Summit 2017
競技スポーツにおいては、アナリティクス活用にはまだまだ課題が多いのが現状だ。そうした課題にどう対応しているのかについて、河合氏が自らの大学の研究成果を交えながら、展望を示した。
関連リンク
ダウンロードBOXに入れる
記事をダウンロードBOXに追加します。よろしいですか?
ブックマーク
記事をブックマークに追加します。よろしいですか?
-
[2021/01/22 08:00] サーバ/ストレージ
-
[2021/01/21 08:00] 開発ソフトウェア
-
$side_seminar_count = $i+1; ?>
-
1/26(火)15:00~17:00
予期せぬ攻撃にも動じないために「セキュリティレジリエンス向上の具体策」
$side_seminar_count = $i+1; ?>
-
1/27(水)15:00~16:50
Kubernetes時代のインフラ構築指針~オンプレミス回帰のその先へ~
$side_seminar_count = $i+1; ?>
-
2021年1月27日(水)14:00~15:00
DXの実現につながるビジネスモデル「サブスクリプション」 実現・運用・収益化のコツ
$side_seminar_count = $i+1; ?>
-
2021年1月27日(水) 13:30~15:30
Palo Alto Networks Forum vol.5 Virtual
$side_seminar_count = $i+1; ?>
-
2021年1月28日(木)13:30~16:40
建設業界のDX促進の方法論 ~安全・安心を維持し事業改善を~
今注目のIT用語の意味を事典でチェック!