【レポート】

Oracle Grid Week - Amazonのリコメンドも支えるGrid BIプラットフォーム

1 データウェアハウスの傾向

  • <<
  • <

1/2

日本オラクルは29日から9月1日の期間で、Oracle Grid Weekを開催。初日には「低コストで統合DWH環境を実現するウェアハウス・グリッド」と題されたセッションが用意された。ここではOracleがReal Application Clusterなどで力を入れるGridの技術をデータウェアハウス(DWH)というアプリケーションにいかに展開するかが語られた。

セッションを担当したのはシステム製品統括本部 営業推進部 Grid Computingグループ担当マネジャーの根岸徳彰氏。同氏は近年みられるDWHの傾向としてデータの増大、コスト削減、リアルタイム性の重視を挙げる。

同氏はWinter Corporationによる、数TBという大規模データベースに特化した調査"TopTen Program"の結果を引き合いに出し、データベースに格納されるデータが飛躍的に増大していると指摘する。

同調査によれば、8年前の1998年、TBを超えるデータベースは数少なく、世界最大はSearsの構築したTeradataによる4TB、2001年はSBCの構築したおなじくTeradataによる10TB、2003年はFrance Telecomの構築したOracleによる30TB、2005年はYahooの構築したOracleによる100TB、とトップの容量は指数的に増加、全体を見ても同様な増加傾向。Winter Corporationでは2008年には1PBのデータを持つ企業が存在するだろうと予測する。

次に指摘されるのはコストの削減。特にLinuxの採用だ。巨大なデータベースを構築する際、従来はSMPのUNIXサーバによるシステムが多かった。しかし、近年目立つのはLinuxを採用した巨大データベースの構築。既に述べたWinter Corporationの調査で100TBを構築していたYahoo!の例ではUNIXを採用しているものの、24TBを構築するAmazon.comではLinux。こうしたLinux採用事例ではSMPではなくGridが採用されている。

Oracleではこうした傾向に対するソリューションとして「ウェアハウス・グリッド」を提案している。

従来は業務データを蓄積するDBからETLを行うステージングサーバを構築、データウェアハウスを構築し、各システムに併せたデータマートを作成していた。オラクルでは、こうしたそれぞれのシステムを統合、ETLからウェアハウス、データマートまでを統合した「統合ウェアハウス」を構築。さらに、これをグリッド上に構築することでコストとワークロードに優れたシステムの構築を実現する。

従来はそれぞれのシステムの最大ピーク時に併せて、それぞれのHWを用意していた。これは非効率。仮想的にクラスタリングすることでピークの異なるそれぞれのシステムを統合、低コストなシステムを実現する。

これは、BIシステムを構成するそれぞれのシステムが迎えるピークの時間がずれているから。ETLは業務が終わったあと最大の負荷がかかる一方で、この間はユーザからのクエリを受け付けるデータマートやウェアハウスに負荷がかからない。一方、業務中にはウェアハウスやデータマートに負荷がかかる。

そこで、それぞれのピーク時に併せたシステムを用意するのではなく、これらを平準化するためにGRIDを構成する。これがウェアハウス・グリッドの基礎となる考え方。つまり、システムの最適化だ。

統合による全体最適化のBIへ

  • <<
  • <

1/2

インデックス

目次
(1) データウェアハウスの傾向
(2) Amazon.comのリコメンドを支えるのは?


転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

求人情報