導入事例
クラウドコンピューティングと人工知能(AI)の上昇は、デジタル経済を支えるインフラにおける劇的な変化を引き起こしました。 「どこでもAI」と「クラウド ubiquity」の共感の背後にあることは、 エネルギー そして、 電力インフラ 現代的なデータ中心が今課す負荷。 この記事では、データセンターで新しい「パワー危機」を調べています。つまり、それが起こっているのは、そのコスト(経済、環境、社会)であり、それが組織にとって何を意味するのか(GPU / CPUのベンチマーク、仮想化、高性能クラウドインフラストラクチャなどの重いワークロードを実行しているものを含む)です。

問題のスケール
サイズ: 1.1 グローバル規模での電力消費量
-
国際エネルギー機関(IEA)によると、データセンターからのグローバル電力消費は現在、 415 テラワット時間(TWh) — 2024年のグローバル電力消費量の約1.5%。 IEAについて+2エネルギーエネルギーのエネルギー省庁+2
-
予測は、このことがほぼ可能であることを示しています ダブル IEAのベースケースのシナリオで2030(〜945 TWh)によって、その時点でのグローバル電力消費の3%未満を表す。 IEAについて+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
米国では、例えば、データセンターは2024年に~183 TWh(≈46%の米国電力消費)で焼却し、2030年までに2倍以上(〜426 TWh)に計画されています。 ピー・リサーチ・センター+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
サイズ: 1.2 AIワークロードの急速な成長
-
成長は「より多くのデータセンター」だけでなく、 加速されたワークロード — GPU/TPU クラスター, 大規模な言語モデルのトレーニング, 推論でスケール. 加速されたサーバー(AI固有の) IEAプロジェクトは、従来のサーバーの1年〜9パーセントの〜30%の成長を促進しました。 IEAについて
-
ゴールドマン・サックスのレポートでは、データセンターのグローバル・パワー・デマンドが最大で増加しています。 165% によって 10 年 (AIとクラウドインフラが大きく推進する2023) ゴールドマン・サックス
-
米国では、モーガン・スタンレーは、 パワーショートフォール 2028年までに、このAIビルドアウトによって駆動される、最大20%のデータセンタレス。 Yahooファイナンス
1.3 電力網およびインフラへの影響
-
需要のスパイクとして、伝達、生成、格子慣性およびローカルutilitiesの緊張は増加します。 たとえば、複数の状態とユーティリティは、既に、サブステーションとグリッドインターコネクトへのアップグレードを必要とするデータセンタラが確認されています。 世界資源研究所+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
特定の地域では、データセンタレスは、ローカル世帯、業界、インフラ計画のノックオン効果がある地域の電力供給の重要な株式を既に消費しています。 ピー・リサーチ・センター
なぜこれがHappeningなのか:ドライバー
2.1 大規模AIとクラウドワークロード
-
ジェネレーションAI、大型モデルのトレーニング、スケールでの推論(リアルタイム、24/7)へのシフトは、はるかに高い 電力密度 サーバワークロードの初期生成よりも。 たとえば、複数のGPUを収容するハイパースケールサーバーラックは、数よりも数キロワットの数十を描画することができます。 arXivの特長+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
スケールの経済とパフォーマンスの必要性のために、これらの施設は、多くの場合、冷却、電力配信、冗長性、稼働時間の封筒を押します。
2.2 場所ベースのスケーリングとクラスタリング
-
多くのデータセンターは、好ましい条件(例えば、低電力コスト、クーラーの気候、税金のインセンティブ)を持つ地域でクラスタリングされています。 しかし、そのようなクラスタリングは作成します 局所的なストレス グリッド上 — グローバルな画像が管理可能かどうか。 ピー・リサーチ・センター
-
これらの大きなサイトをサポートするためのインフラ — パワー・サブステーション、大容量トランス、長距離伝送ライン — 多くの場合、ビルドアウトペースの背後にある。
2.3 エネルギー効率と冷却オーバーヘッド
-
計算力を引き越えれば、データ中心電力の有意なシェアは入ります 冷却、換気、電力配分の損失. . より多くのパワー高密度施設、より大きな頭上。 ピー・リサーチ・センター+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
一部の冷却システムは、高効率な設備で、全データセンタの電力を最大〜30%(以上)消費することができます。 高能率なハイパースケールはこれを軽減しますが、密度が増加するにつれて、冷却要求が上昇します。 ピー・リサーチ・センター
2.4 再生可能エネルギーの統合と断続的な課題
-
再生可能エネルギー(風力・太陽光)や、原子力を利用してデータセンターに電力を供給することを目指している多くの事業者。 しかし、再生可能エネルギーは 断続的な、およびAIの計算の実時間要求は頻繁に安定した、良質力を必要とします。 ユーティリティは、容量または伝送ライン、複雑な許可、および負荷で再生可能エネルギーを整列する難しさを追加するために、長いリードタイムを報告します。 ビジネスインサイダー
-
それゆえに、多くの施設を実践することは、従来のソースから化石燃料バックアップやグリッド電力に依存しています。これにより、排出量を上げ、持続可能性の物語を複雑化します。
隠されたコスト — サーバービルを超えて
3.1 経済/グリッドコストの外部性
-
グリッドの容量の大きい部分をデータ中心に要求する場合、ユーティリティのアップグレード(生成、伝達、サブステーション)のコストが頻繁に渡される 他の顧客 — 世帯や中小企業 たとえば、米国の一部の州の世帯は、ユーティリティがインフラの変化をカバーするために率を上げる必要があるため、より高い法案を見ています。 ピー・リサーチ・センター+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
グリッド容量が狭い地域では、データ遠心分離機のインターコネクトの待ち時間が年を延ばすことができ、ビジネスの立ち上げや移転の強制遅延が起こります。 ログイン
3.2 環境とカーボンフットプリントの影響
-
電力の電力は、依然、多くの地域で化石燃料から大きな部分に来ます。 使用量が倍増し、再生可能であれば、排出量が上昇します。 数年にわたり、化石燃料依存のインフラでロックするリスクを増加させるデータセンタもあります。 金融タイムズ+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
-
冷却および電力インフラの使用水(特に蒸発冷却) — つまり、水ストレスの多い地域でのデータ中心が作成される 二次環境圧力お問い合わせ ニュースレター
3 機会コストとインフラ競争
-
巨大なデータセンターで使用される土地、電力、水および冷却資源は、それ以外の場合、製造、地域コミュニティ、または中小企業に役立ちます。 質問を上げる 地方株式、特にローカルのメリット(ジョブ、税金収入)がリソース消費に限られている場合。
-
パワーインテンシブワークフローに依存する企業(例えば、GPUベースのベンチマーキング、高スループット仮想化)、パワー&冷却のための上昇の競争は、次のようになります。
-
ホスティング/クラウドコンピューティングのコストが高い
-
容量のためのより長い調達期間
-
「プレミウム」の電力・低レイテンシインフラへのアクセスが著しく低下
-
3.4 信頼性と回復リスク
-
過負荷または近容量のグリッドは、リスクを低減し、故障や極端な天候へのレジリエンスを減らし、茶色のアウトや冗長性を低下させる可能性が高くなります。 両方とも、データセンタレス自身 そして、 周辺インフラ(ホーム、病院等) これらのストレスポイントのユーティリティはすでに警告しています。 ビジネスインサイダー+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + 1
重いワークロードの手段: ベンチマーキング、仮想化とクラウドアーキテクチャ
GPU/CPU のベンチマーキング、仮想化、パッケージングおよびハイブリッド/クラウドの展開に焦点を合わせると、パワーとインフラのディメンションがますます関連しています。 以下は:
4.1 Benchmarkフレームワークはインフラコストを組み込む必要があります
-
ベンチマーキングスイートまたは仮想化スタック(例えば、GPUオフロード、マルチノードクラスター、VMware/VirtualBox、AIインフェレンスパイプラインによる仮想化)を設計する場合、生の計算メトリック(GFLOPS、帯域幅)だけでなく、 力費、冷却の頭上および仕事ごとのエネルギー効率お問い合わせ
-
クラウド展開(Microsoft Azure / AWS / GCP など)では、インフラの制約(電力と冷却)を根本化することでコストが増加し、価格、可用性、性能に影響を与える可能性があります。
4.2 仮想化とハイブリッド計算インプリケーション
-
ハイブリッドまたはオンプレミス+クラウドモデル(例えば、Windows VM、GPU/CPUオフロードをローカルボックスからクラウドにデプロイする場合)をデプロイする場合、 マージンコスト そして、 エネルギーフットプリント これらのデータ中心のホップ。 一部のワークロードは、制約された電力を持つ領域でホストされている場合、クラウド上でより効率的なローカル(冷却/電力コストに依存)である可能性があります。
-
仮想化オーケストレーションは監視する必要があります パワークォータ、特に多テナント/hyperscale 環境で。 ワークロードスケジューリングは、電力レート/可用性が有利であるときに時間/場所を選ぶ必要があるかもしれません。
4.3 地理的およびエネルギー調達の選択問題
-
展開のためのクラウドまたはデータセンタリー地域を選択する場合、 エネルギー源の組合せ、グリッド容量、パワーコストエスカレーションリスク、冷却環境問題。 一部の地域には、データセンタの貫通による電力不足や将来のコストのリスクが遅れている可能性があります。
-
たとえば、低スペア生成マージンを持つデータ中心領域は、レートハイクやカーテールメントに直面する可能性があります。 これは、あなたの重いワークロードのSLA、コスト、および性能に影響を与える可能性があります。
4.4 サステナビリティとマーケティングの角度
-
ベンチマークの結果、記事、またはモジュール(頻繁に行うように)を公開する場合、エネルギー/効率性次元(例えば、この地域のkWhあたりのX GFLOPS)を、視聴者の関心を投げる可能性があります。特に、環境圧力が成長します。
-
IT専門家やパフォーマンス愛好家のコミュニティのために、ハイライト タスクごとのエネルギーコスト, 冷却効率, ベンチマークごとのサーバー パワーの引くこと, 別の演算子を追加します。.
危機を緩和するための戦略
ここでは、マクロ(産業/ユーティリティ)レベルとマイクロ(エンタープライズ/開発)レベルの両方で実用的な戦略があります。
5.1マイル 業界/ユーティリティレベル
-
要求応答プログラム: 大量のデータセンタレスは、グリッドのストレスを緩和するために、グリッドデマンドレスポンススキーム(ピーク時の負荷を減らす)に参加できます。 たとえば、Google LLCは、ピークグリッドの要求時にAI-data-centreの電力使用量をスケールバックするために、米国の合意に署名しました。 ロイター
-
格子および伝達投資: : : ビルドアウトをサポートするために、ユーティリティは、生成能力、伝送ライン、サブステーションを追加する必要があります。多くの場合、10年以上のプロセス。 ここでは、ボトルネックのリスクを増加させます。 デロイト
-
グリーンパワーソーシング+マイクログリッド: データセンタレスは、再生可能で、オンサイト生成、蓄電池、またはマイクログリッドの信頼性を削減できます。
-
透明性と報告: : : オペレータは、規制当局やコミュニティが影響を評価することを可能にするために、実際の電力使用量、冷却メトリック、PUE(電力使用効率)などを報告する必要があります。 多くのアナリストは、開示の欠如を呼んでいます。 金融タイムズ
5.2マイル 展開/エンタープライズレベルで
-
地域とエネルギーのソースを厳選: : : 良好なグリッド容量、有利な電力レート、強力な再生可能エネルギーミックス、および制約のリスクの低リスクで、データセンタリー地域を選択します。
-
ワークロードスケジューリングの最適化: : : 重負荷(ベンチマークラン、モデルトレーニング)、ピーク時間または電力コストが下がるときのスケジュール。 地域差をコスト/時間で使う
-
パワーアウェアベンチマーキング&アーキテクチャ設計: : : 計算時間だけでなく、ベンチマークごとのエネルギー消費量(kWh)を測定します。 生の速度だけでなく、結果あたりのエネルギーを最適化します。
-
冷却および効率の改善: : : オンプレミスまたはエッジの展開については、高効率冷却、液体冷却、ラック密度のトレードオフ、エネルギー効率のためのサーバー選択を検討してください。
-
ハイブリッド/エッジの代替品を探索: : : クラウド・データ・インセンティブが制約やコストが高い場合、ローカルまたはエッジ・コンピュートがより良いトレードオフになる可能性があります。
リスクと展望
6.1 の 成長がチェックされていない場合はどうなりますか?
-
主アナリストが警告 グリッド容量の不足、特に力集中的な地域。 モルガン・スタンレーは、2028年までに米国のデータ遠心力で20%の不足分の推定値が収斂指標です。 Yahooファイナンス
-
力が制約された場合、潜在的なリスクは次のとおりです。
-
高い運用コスト(電力価格上昇)
-
-
データの集中的な展開のためのより長いリードタイム
-
より多くの頻繁なカリキュラムやコンピュートインテンシブワークロードの制限
-
AIインフラのスローワーロールアウト(ロッシー成長期待に反する)
-
化石燃料がギャップを埋めるのに使用される場合、非常に高い環境の足跡
6.2 肯定的な見通し/変化のためのレバー
-
効率の利益: 計算の需要が上昇しても、チップアーキテクチャの改善、冷却、ワークロードスケジューリングは、適度な電力成長が可能です。
-
再生可能エネルギーと原子力発電の蓄積: すでに原子力または大規模再生可能エネルギーとの電力購入契約に署名している大手テック企業もいます。 たとえば、一部のデータセンタは、需要を満たすために再発核植物とペアリングされています。 ル・モンド
-
スマートな格子統合: 電力が安くても、再生可能エネルギーが豊富(需要対応)の場合、データセンタは柔軟に負荷がかかる場合があります。
-
メトリックと透明性: 利害関係者(政府、投資家、コミュニティ)がより多くの質問をすると、データ中心はよりエネルギー/冷却のメトリックを公開する可能性が高いため、よりスマートな計画とベンチマークが可能になります。
あなたとあなたの聴衆のための推奨行動
興味を持ち、ベンチマーキング、仮想化、パッケージング、ITコミュニティコンテンツに取り組むには、以下のような具体的なアクションがあります。
-
ベンチマークレポートにエネルギーメトリックを含める
-
GPU/CPU のベンチマークを実行すると、「ランタイム」だけでなく、「エネルギー消費量(kWh)」のみをキャプチャし、「KWHあたりのGFLOPS」または同様の効率測定を計算します。
-
コストだけでなく、エネルギー効率の異なるクラウド/領域を比較します。
-
-
サイト/フォーラムのコンテンツを書く
-
「クラウドコンピューティングのエネルギーコスト:どのITが知っておくべきか」という記事やシリーズを制作 — プロファイルパワー制約、地域グリッドのストレス、冷却の懸念、コストリスク。
-
-
他のパフォーマンス/仮想化に焦点を当てたコンテンツを補完する「パワー&パフォーマンスによるクラウド領域の選択」のためのガイドを提供します。
-
仮想化とハイブリッドユースケース
-
オンプレミスGPU / CPUオフロード(GPUはGTX 770 + Quadro K420などでオフロードを計算)する方法をご覧ください。 制約された領域でハイパースケールのクラウドクラスターを使用して、エネルギー単位の対比を比較します。
-
コミュニティのGPUクラスターエネルギーを測定するためのプラグイン、パワープロファイバ、パワープロファイバなどのケーススタディやツール(例:、パワープロファイラ)を公開します。
-
-
包装及び配置検討
-
モジュール/プラグイン/アプリ(例えば、Joomlaモジュール、GPU/AIベンチマークアプリ)を設計する際に、「eco-mode」オプションを追加することを検討してください。例えば、オフピーク時間中にジョブをスケジュールし、低電力描画、ログ出力消費メトリックのスロットルをスケジュールします。
-
-
仮想化(VMware/VirtualBoxなど)では、パワードローを減らすためのドキュメントのベストプラクティス(例えば、オーバープロビジョニング、アイドルワークロードの統合、冷却/ホストのパワーフィーチャを有効にします。
-
クラウドプロバイダーの透明性に取り組む
-
クラウド/データセンタプロバイダがメトリック(PUE、エネルギーミックス、水使用量)を公開し、コンテンツを強調表示する追跡を続けます。
-
コミュニティメンバーに「この地域のエネルギー源は何ですか? 予備の格子容量は何ですか。 パワークォーター/カットオフリスクはありますか? ツイート
-
コンテンツ
クラウドとAIの隠れたコストは、サブスクリプション料金で支払ったドルではありません。 大規模で急速に加速する電力とインフラの負担 「コンプトサイクル」の背後にあること。 データはもはやインターネットの受動的な奥の部屋ではありません。 産業用電力顧客 その成長は、ユーティリティ、グリッド、家庭、産業、環境、そして自分自身のようなパフォーマンス指向のIT専門家のための遠距離の含意を運ぶ。
危機(または多分挑戦)は本当です:成長する需要、制約された供給、老化する格子、冷却及び環境のための必要性へのすべてのポイントへの負荷 より責任ある計画, 地域密着型展開, エネルギー効率の高いアーキテクチャと 透明なメトリック. . GPU/CPU、仮想化、パッケージモジュール、クラウドデプロイメントをベンチマークする、重負荷をビルドする人のために、この次元は無視できません。


11681
IT Pro 



















