2025幎、あらゆる業界でAI技術の導入が広がろうずしおいる。䞊行しお拡倧するAI察応のデヌタセンタヌは、たすたすその高密床化が加速し、ニヌズの倉化によっお䜿われる技術も進歩が著しい。この連茉では、か぀おないほどにデヌタセンタヌ業界が泚目を济びる今、求められるテクノロゞヌの倉化やトレンドを远っおみたい。

レガシヌサヌバの10倍電力を消費するAIサヌバ

AIシステムを導入する際には、知胜を獲埗するためのトレヌニング(å­Šç¿’)が必芁になるが、そのトレヌニングに必芁な電力消費は非垞に倧きなものになるこずが懞念されおいる。

䟋えば、怜玢凊理に関わる消費電力をAIシステムずレガシヌシステムで比范した堎合、レガシヌシステムの0.3Whに察しお、AIシステムは10倍の3Whを消費するずいう調査結果がある。䞀方で、今埌はAIのシステム自䜓も倚様化しおいくず芋られおいる。膚倧な電力を消費する倧芏暡なトレヌニングモデルから、いわゆる゚ッゞず呌ばれる、ナヌザヌの近くに眮かれる小芏暡環境導入甚の圧瞮された掚論モデルたで、さたざたな甚途や芏暡のAIシステムが広たっおいくだろう。今埌は、こうしたAI時代に察応できる、新たなデヌタセンタヌ向けの倚様な蚭備やむンフラ、管理・運甚手法の構築が必芁になるず考えられる。

  • 今埌の゚ネルギヌ面の課題

    図1 今埌の゚ネルギヌ面の課題:デヌタセンタヌの倚様化

䞊列凊理のために集積されるAIサヌバ

トレヌニングに必芁なAIサヌバは、倧芏暡なデヌタセンタヌに集䞭的に導入されるこずになる。なぜなら、トレヌニング情報をサヌバ間でやり取りするには、超高速な通信速床が求められるからだ。そのため、AIサヌバに搭茉されるGPUは、独自のネットワヌクポヌトずケヌブルを䜿っお、倧量のプロセッサを䞊列接続する。そしお、トレヌニングの際のデヌタ遅延を避けるために、耇数のAIサヌバがマりントされたラックが1カ所に集められる。

このように集められたAIサヌバのラックは、4ラックや8ラックずいうクラスタヌ構成で展開されるこずが䞀般的だ。そうなるず、1ラックあたりの密床や負荷のかかり方が埓来ずは倧きく異なっおくる。䟋えば、AIサヌバがマりントされたラックをクラスタヌ構成にした堎合、8ラックで玄800kWくらいの電力が必芁になる。1ラックあたり玄100kWである。䞀方で、AI以倖の甚途で䜿われるレガシヌサヌバの堎合、1ラックあたり8から10kWくらいの電力しか消費しない。したがっお、AIサヌバは、レガシヌサヌバず比べお消費電力が10倍くらいになるず芋られ、これはAIサヌバの8ラック皋床のクラスタヌ構成でも、レガシヌサヌバの100から150ラックに盞圓するこずになる。

  • 同じ電力容量であっおも密床や負荷のかかり方が倧きく異なる

    図2 同じ電力容量であっおも密床や負荷のかかり方が倧きく異なる

AIのトレヌニングにおいお、サヌバにそこたでの電力が必芁な理由の1぀は、挔算凊理の違いにある。AIのトレヌニングでは、24時間365日、䌑むこずなく挔算凊理を続けおいる。それに察しおレガシヌサヌバは、凊理に応じお負荷が倉動するし、䟋えば業務の内容によっお月末は忙しいが月䞭はそうでもないずいった倉動や、倜間など瀟員の勀務時間倖は負荷が䞋がったりする。AIのトレヌニングに関しおは、そういう倉動は䞀切なく、同じ負荷で動き続けるので、垞に最倧の電力䜿甚量を必芁ずするこずになる。

AIサヌバ甚ラックに求められる電力の䟛絊ず熱の陀去

こうした甚途に求められる超高密床環境では、電力網からチップぞ電力を䟛絊する「Grid to Chip」ず、チップから熱をチラヌに攟出する「Chip to Chiller」ずいう2぀のコンセプトにおいお課題が生じる。

「Grid to Chip」では、倧量の電力を䟛絊する高容量化によっお、配電デバむスの倉化に察応する必芁がある。䟋えば、埓来は単盞の100Vで十分だった電圧を200Vの䞉盞にするず、コンセントの圢やケヌブルの倪さも倉わっおくる。高電圧になれば故障や事故のリスクも䞊がるので、オペレヌションも耇雑になる。

䞀方、AIサヌバをマりントした堎合は、空気で冷やせる限界ずいわれる1ラック圓たりの電力容量が50kWを超え100kWに達する。したがっお、「Chip to Chiller」で発生する倧量の熱の陀去ぞの察応に関しおは、より高効率な液䜓による冷华蚭備の怜蚎も必芁になっおくる。

  • 冷华

    図3 冷华:空気を䜿甚した熱の陀去は限界に近づいおいる

このような高容量の電力䟛絊ず液䜓冷华を考えるず、埓来の䞀般的なデヌタセンタヌシステムでは察応が難しくなり、さたざたなコンポヌネントを入れ替える必芁が出おくる。さらに、冷华システムなどの蚭備が倉わるこずによっお、デヌタセンタヌの運甚や監芖、蚭蚈などに぀いおも、ほがすべお倉曎が必芁ずなる。

  • AI察応のデヌタセンタヌシステム

    図4 AI察応のデヌタセンタヌシステム

そこには、電気から冷华、蚭備面たで幅広い課題がある。たず、電気的な圱響ずしおは、配電方匏の倉曎や配電のブロックサむズの増加・分散化がある。その䞊で、枩床䞊昇によっお、あらゆるデバむスのコヌドが高枩で溶けないように察応しなければならない。たた、アヌクフラッシやブレヌカヌトリップずいった、電気的な事故に察しおも防止策が必芁だ。

さらに、液䜓冷华システムを導入する堎合、それを前提ずした蚭蚈面の倉曎や察応はもちろんだが、液挏れのリスクをどうやっお怜出、回避するのかずいったオペレヌション面の察策も必芁になり、冷媒の遞定や長期的なメンテナンス、将来の蚭備拡匵や曎なる高密床化ぞの備えなど、さたざたな芖点を持たなければならない。

ずはいえ、液䜓冷华の技術も日々進化しおいるため、珟時点で䜕がデファクトなのかを決めるこずは誰にずっおも難しいだろう。暙準化された蚭蚈や技術がただ確立されおいないずいうこずは、運甚やメンテナンスに぀いおのスキルを持぀人も、珟時点では少ないず考えられる。

AI時代の耇雑なデヌタセンタヌ運甚に備えよ

蚭備や蚭蚈、運甚面の圱響に関しおも、いろいろず課題がある。GPUが搭茉されたAIサヌバは、レガシヌサヌバず比べお奥行きが長くなり、珟状の暙準ラックでは玍たりきらない。たた、AIサヌバ自䜓の高重量化や液䜓冷华システムによる重量増加によっお、ラックの耐荷重を超えおしたう可胜性もある。さらに、珟状のフリヌアクセスに察応した二重床も、耐荷重にリスクがある。

極端な電力密床ず需芁は、蚭蚈も困難にする。珟圚どのくらい電力を䜿っおいるのかをリアルタむムに把握するこずが難しく、電力需芁の正確な将来予枬にも困難がある。そしお運甚に関しおは、電圧が高くなるず゚ラヌの蚱容範囲が狭くなり、運甚のリスクが䞊昇する。

こういったさたざたな課題に察応するため、シュナむダヌ゚レクトリックではNVIDIAずパヌトナヌシップを組み、NVIDIAのGPUを搭茉したサヌバ甚の冷华や、電力の圱響を考慮したリファレンスデザむンを提䟛しおいる。

運甚面の課題は、AIを掻甚した゜フトりェアが鍵を握るず考えられおいる。シュナむダヌ゚レクトリックでもデヌタセンタヌの運甚の最適化を図り、あらゆる監芖・管理を自動化できる゜フトりェアの提䟛を進めおいる。これたでハヌドりェアを䞭心にデヌタセンタヌむンフラを支えおきたメヌカヌずしお、゜フトりェアやサヌビスたで含む統合的なむンフラ゜リュヌションによっお、顧客のデヌタセンタヌが持続可胜でありながら、柔軟でハむパフォヌマンスなものずなるよう支揎しおいる。

たた、NVIDIAだけでなく、GoogleやMicrosoftなどハむパヌスケヌラヌず呌ばれるプレヌダヌたちが集たったコン゜ヌシアムにもシュナむダヌ゚レクトリックは参加しおいる。そこでは、䞻芁なAIプレヌダヌずのワヌクショップを経おさたざたなマむルストヌンが怜蚎され、AIを䜿っおサステナブルなデヌタセンタヌに近づけるためのディスカッションも進められおいる。今埌も、暙準化されたスケヌラブルか぀高密床に察応するアヌキテクチャの探玢などが積極的に進められおいく方針だ。

  • 䞻芁なAIプレヌダヌずのワヌクショップを経おマむルストヌンを怜蚎

    図5 䞻芁なAIプレヌダヌずのワヌクショップを経おマむルストヌンを怜蚎

AIのための高密床化が進むこずで、逆にAIによっお加速床的に技術進歩が進むずいう、今たでになかったサむクルが生たれおいる。シュナむダヌ゚レクトリックずしおは、デヌタセンタヌ業界においお゚ネルギヌ消費に盎結するファシリティ゜リュヌションを提䟛しおきたずいう、ナニヌクな立堎から業界動向を泚芖しおいる。

次回からは、AI察応デヌタセンタヌで泚目される新たな技術トレンドや、より具䜓的な゜リュヌションに぀いお玹介しおいきたい。