مقدمه مقدماتی
ظهور محاسبات ابری و هوش مصنوعی (AI) باعث تغییر چشمگیر در زیرساخت هایی شده است که اقتصاد دیجیتال را تقویت می کند. چیزی که اغلب در پشت هیجان جمعی “AI Everywhere” پنهان می شود و “آبجکت ابری” عظیم است. انرژی انرژی و زیرساخت های قدرت این بار که امروزه مرکز داده های مدرن اعمال می شود. در این مقاله من "بحران قدرت" نوظهور را در مراکز داده بررسی می کنم - چه اتفاقی می افتد، چرا این اتفاق می افتد، چه هزینه های آن (اقتصاد، زیست محیطی، اجتماعی) و چه چیزی برای سازمان ها (از جمله کسانی که در حال اجرا کارهای سنگین مانند GPU/CPU، مجازی سازی و زیرساخت های ابر با کارایی بالا هستند).

مقیاس مشکل
1.1 مصرف برق در مقیاس جهانی
-
طبق گزارش آژانس بین المللی انرژی (IEA)، مصرف جهانی برق از مراکز داده در حال حاضر در اطراف آن است. ۴۱۵ تراوات-ساعت (TWh) حدود 1.5 درصد از مصرف جهانی برق در سال 2024 IEA+2وزارت انرژی+2
-
پروژه ها نشان می دهند که این کار تقریبا می تواند دو برابر تا سال ۲۰۳۰ (تا ۹۴۵ TWh) در سناریوی پایگاه IEA که تنها کمتر از ۳ درصد از مصرف برق جهانی را در آن زمان نشان می دهد. IEA+ + 1 1
-
به عنوان مثال، در ایالات متحده، مراکز داده از طریق ~۱۸۳ TWh در سال ۲۰۲۴ سوزانده شده اند ( ۴ درصد از مصرف برق ایالات متحده) و پیش بینی می شود که تا سال ۲۰۳۰ بیش از دو برابر شود (~ ۴۲۶-۱۰ وات). مرکز تحقیقات Pew Research Center+ + 1 1
1.2 رشد سریع حجم کاری AI
-
رشد نه تنها از "مراکز داده های بیشتر" بلکه از "مرکز داده های بیشتر" است. تسریع حجم کاری - خوشه های GPU/TPU، آموزش مدل زبان بزرگ، در مقیاس. برای سرورهای شتاب دهنده (AI- Special) IEA رشد پروژه های ~30٪ در سال در مقابل ~9٪ برای سرورهای معمولی است. IEA
-
گزارشی از پروژه های گلدمن ساکس حاکی از افزایش تقاضای قدرت جهانی است 165% تا پایان یک دهه (در مقایسه با 2023) به شدت توسط زیرساخت های هوش مصنوعی و ابر هدایت می شود. گلدمن ساکس
-
در ایالات متحده، مورگان استنلی هشدار می دهد کمبود قدرت از 20٪ برای مراکز داده از طریق 2028، که توسط این AI ساخته شده است. Yahoo Finance
1.3 مفاهیم برای شبکه های برق و زیرساخت
-
همانطور که تقاضا افزایش می یابد، فشار انتقال، نسل، Inertia شبکه و خدمات محلی افزایش می یابد. به عنوان مثال، بسیاری از کشورها و خدمات در حال حاضر خوشه های داده محور را که نیاز به ارتقاء به ایستگاه های فرعی و ارتباطات شبکه دارند، می بینند. موسسه منابع جهانی+ + 1 1
-
در برخی مناطق، مراکز داده در حال حاضر سهم قابل توجهی از تامین برق محلی را مصرف می کنند که اثرات آن برای خانواده های محلی، صنعت و برنامه ریزی زیربنایی است. مرکز تحقیقات Pew Research Center
چرا این اتفاق می افتد: رانندگان
2.1 Hyperscale AI و حجم کاری ابری
-
تغییر به هوش مصنوعی عمومی، آموزش مدل بزرگ، استنتاج در مقیاس (در زمان واقعی، 24/7) بسیار بالاتر است. ویژگی های قدرت بیش از نسل های قبلی حجم کار سرور به عنوان مثال، یک قفسه سرور hyperscale بسیاری از GPU ها ممکن است ده ها کیلووات را به جای چند عدد جذب کند. arXiv+ + 1 1
-
به دلیل اقتصاد مقیاس و نیاز به عملکرد، این امکانات اغلب پاکت خنک کننده، تحویل برق، افزایش زمان - که همه آنها افزایش هزینه و پیچیدگی.
2.2 مقیاس پذیری مبتنی بر مکان و خوشه بندی
-
بسیاری از مراکز داده در مناطق با شرایط مطلوب (به عنوان مثال، هزینه کم برق، آب و هوای خنک تر، مشوق های مالیاتی) دسته بندی می شوند. اما چنین خوشه ای ایجاد می کند. استرس محلی در شبکه، حتی اگر تصویر جهانی قابل کنترل به نظر برسد. مرکز تحقیقات Pew Research Center
-
زیرساخت ها برای حمایت از این سایت های بزرگ – ایستگاه های برق، ترانسفورماتورهای با ظرفیت بالا، خطوط انتقال طولانی – اغلب پشت سرعت ساخت و ساز قرار می گیرند.
۲.۳ هزینه های انرژی و هزینه های خنک کننده
-
فراتر از قرعه کشی قدرت محاسبه، سهم قابل توجهی از برق مرکز داده وارد می شود خنک کننده، تهویه، زیان توزیع برق... هر چه قدرت بیشتری داشته باشد، هر چه بیش تر از آن است. مرکز تحقیقات Pew Research Center+ + 1 1
-
برخی از سیستم های خنک کننده می توانند تا 30٪ (یا بیشتر) از کل قدرت داده محور در امکانات کمتر کارآمد مصرف کنند. افراد با کارایی بالا این را کاهش می دهند، اما با افزایش تراکم، تقاضای خنک کننده افزایش می یابد. مرکز تحقیقات Pew Research Center
2.4 چالش های یکپارچه سازی و ناتوانی
-
بسیاری از اپراتورهای هدف استفاده از انرژی های تجدید پذیر (wind/solar) و یا حتی هسته ای برای تامین قدرت مراکز داده خود هستند. اما تجدید پذیرها متناوب متناوبو تقاضای زمان واقعی محاسبه هوش مصنوعی اغلب به قدرت پایدار و با کیفیت بالا نیاز دارد. گزارش آب و هوا زمان های طولانی برای اضافه کردن ظرفیت یا خطوط انتقال، مجوز پیچیده و مشکل هماهنگ کردن انرژی های تجدید پذیر با بار. Business Insider
-
از این رو، در عمل بسیاری از امکانات هنوز به پشتیبان گیری سوخت فسیلی یا قدرت شبکه از منابع سنتی متکی هستند که انتشار گازهای گلخانه ای را افزایش می دهد و روایت های پایداری را پیچیده می کند.
هزینه های پنهان – Beyond the Server Bill
3.1 هزینه های اقتصادی / شبکه
-
هنگامی که دیتامحورها بخش های بزرگی از ظرفیت شبکه را مطالبه می کنند، هزینه ارتقاء بهره وری (نسل، انتقال، ایستگاه های فرعی) اغلب به مرحله انتقال می رسد. مشتریان دیگر خانواده ها و کسب و کارهای کوچکتر به عنوان مثال، خانواده ها در برخی از ایالت های ایالات متحده در حال مشاهده صورتحساب های بالاتر هستند، زیرا خدمات باید نرخ ها را برای پوشش تغییرات زیربنایی افزایش دهند. مرکز تحقیقات Pew Research Center+ + 1 1
-
در مناطقی که ظرفیت شبکه تنگ است، زمان انتظار برای ارتباطات داده محور می تواند سال ها گسترش یابد - تاخیر در راه اندازی کسب و کار و یا جابجایی. MLQ
۳- اثرات زیست محیطی و کربن
-
برق برق مرکز داده هنوز هم در بخش بزرگی از سوخت های فسیلی در بسیاری از مناطق است. اگر استفاده از دو برابر و انرژی های تجدید پذیر به این ترتیب مقیاس پذیر نباشد، انتشار گازهای گلخانه ای افزایش می یابد. برخی از گسترش های داده محور خطر قفل شدن در زیرساخت های وابسته به سوخت فسیلی را برای سال ها فراهم می کند. فایننشال تایمز+ + 1 1
-
خنک کننده و زیرساخت های برق از آب (به ویژه خنک کننده تبخیری) استفاده می کنند که به معنی مراکز داده در مناطق دارای تنش آب است. فشارهای محیطی ثانویه... ویکی پدیا
3.3 هزینه فرصت و رقابت زیربنایی
-
زمین، قدرت، آب و منابع خنک کننده مورد استفاده توسط مرکز داده های غول پیکر می تواند در غیر این صورت به تولید، جوامع محلی یا کسب و کارهای کوچکتر خدمت کند. این پرسش ها را مطرح می کند عدالت منطقه ایبه ویژه اگر مزایای محلی (شغل، درآمد مالیاتی) نسبت به مصرف منابع محدود باشد.
-
برای کسب و کارهایی که به جریان های کاری پر انرژی متکی هستند (به عنوان مثال، معیار مبتنی بر GPU، مجازی سازی با خروجی بالا)، رقابت فزاینده برای قدرت و خنک کننده ممکن است منجر به:
-
هزینه بالاتر میزبانی / محاسبه ابری
-
زمان های طولانی تر برای ظرفیت
-
احتمالا دسترسی پایین تر به قدرت "premium" / زیرساخت های کم ارتفاع
-
۴.۴ ریسک قابلیت اطمینان و انعطاف پذیری
-
شبکه های بیش از حد بارگذاری یا نزدیک به حد خطر کاهش ضعف، انعطاف پذیری کمتر نسبت به شکست ها یا آب و هوا شدید، و شانس بالاتر از قهوه ای و یا کاهش Redundancy. هر دو برای خود پایگاه داده ها و برای زیرساخت های اطراف (خانه ها، بیمارستان ها و غیره) خدمات درمانی از این نقاط استرس هشدار می دهد. Business Insider+ + 1 1
چه معنایی برای بارهای کاری سنگین دارد: اندازه گیری، Virtualization و Cloud Architecture
با توجه به تمرکز شما بر معیار GPU/CPU، مجازی سازی، بسته بندی و استقرار های هیبریدی / ابر، ابعاد قدرت و ضد ساختار به طور فزاینده ای مرتبط است. در اینجا چگونگی:
۴.۱ چارچوب های معیاری باید هزینه های زیربنایی را شامل شوند
-
هنگامی که شما طرح های معیاری یا پشته های مجازی سازی (به عنوان مثال، GPU off-load، خوشه های چند گره، مجازی سازی با VMware/VirtualBox، خط لوله استنتاج AI)، نه تنها معیارهای محاسبه خام (GFL، پهنای باند) را در نظر بگیرید، بلکه همچنین با VMware/VirtualBox، خط لوله استنتاج AI، نه تنها معیارهای محاسباتی خام (GOPS، پهنای باند) را در نظر بگیرید. هزینه برق، هزینه خنک کننده و صرفه جویی در انرژی در هر شغل...
-
برای استقرار ابر (به عنوان مثال، در مایکروسافت Azure / AWS / GCP)، هزینه به طور فزاینده ای تحت تاثیر محدودیت های زیربنایی (قدرت و خنک کننده) - که ممکن است بر قیمت گذاری، در دسترس بودن و عملکرد تاثیر بگذارد.
4.2 Virtualization و Dynamic Computing
-
اگر شما در حال ساخت مدل های هیبریدی یا آنلاین + ابر (به عنوان مثال، ویندوز VM، GPU/CPU از جعبه های محلی به ابر)، شما می خواهید برای ارزیابی هزینه حاشیه ای و چاپ انرژی از آن دسته از داده ها-مرکزها برخی از کارهای کاری ممکن است به صورت محلی کارآمد تر باشد (بسته به هزینه خنک کننده / قدرت) نسبت به ابر اگر در یک منطقه با قدرت محدود میزبانی شود.
-
ارکستر مجازی سازی باید نظارت کند سهمیه قدرتبه ویژه در محیط های چند نفره / کمپر. برنامه ریزی بارگذاری کار ممکن است نیاز به انتخاب زمان / مکان زمانی که قدرت / در دسترس بودن مطلوب است.
4.3 انتخاب منابع جغرافیایی و انرژی مهم است
-
هنگام انتخاب مناطق ابری یا مرکز داده برای استقرار، ترکیب منبع انرژیظرفیت شبکه، خطر افزایش قدرت، خنک کننده محیط زیست مهم است. برخی از مناطق ممکن است خطر کمبود برق یا هزینه های آینده بالاتر به دلیل نفوذ به پایگاه داده داشته باشند.
-
به عنوان مثال، یک منطقه مبتنی بر داده با حاشیه نسل کم ممکن است با افزایش نرخ یا محدودیت مواجه شود. این ممکن است بر SLAs، هزینه و عملکرد کارهای سنگین شما تأثیر بگذارد.
4.4 پایداری و زاویه بازاریابی
-
اگر نتایج، مقالات یا ماژول های معیاری را منتشر می کنید (همانطور که اغلب انجام می دهید)، سپس اضافه کردن ابعاد انرژی / کارآیی (به عنوان مثال، “X GFLOPS در هر کیلووات ساعت در این منطقه”) ممکن است برای مخاطبان شما مورد علاقه قرار گیرد - به ویژه به عنوان فشار زیست محیطی رشد می کند.
-
برای جامعه شما از متخصصان IT و علاقه مندان به عملکرد، برجسته کردن هزینه انرژی در هر کار, خنک کننده- کارآیی, قدرت سرور در هر معیار, یک متخصص متفاوت اضافه کنید.
استراتژی ها برای حذف بحران
در اینجا برخی از استراتژی های عملی هر دو در سطح ماکرو (صنعتی / انعطاف پذیری) و سطح میکرو (داخل / اشتغال) وجود دارد.
5.1 در سطح صنعت / آرامش
-
برنامه های تقاضا-پاسخداده های بزرگ می توانند در طرح های تقاضای شبکه شرکت کنند (در طول اوج بارگذاری می شود) تا استرس شبکه را تسکین دهند. به عنوان مثال، Google LLC توافقنامه هایی را در ایالات متحده امضا کرد تا استفاده از قدرت هوش مصنوعی-داده مرکزی خود را در طول تقاضای شبکه اوج افزایش دهد. رویترز رویترز
-
شبکه و انتقال سرمایه گذاری: برای حمایت از ساخت و ساز، خدمات نیاز به اضافه ظرفیت نسل، خطوط انتقال و ایستگاه های فرعی - اغلب یک فرآیند چند دهه ای. تاخیر در اینجا افزایش خطر تنگنا Deloitte
-
منبع برق سبز + میکروشبکه هاData-Centers می تواند انرژی های تجدید پذیر را ایجاد کند، تولید در محل، ذخیره سازی باتری یا میکروشبکه ها را برای کاهش وابستگی به شبکه های فشرده.
-
شفافیت و گزارش: اپراتورهای باید استفاده از قدرت واقعی، معیارهای خنک کننده، PUE (اثر استفاده از قدرت)، و غیره را گزارش کنند تا به تنظیم کنندگان و جوامع اجازه دهند تا تاثیر را ارزیابی کنند. بسیاری از تحلیلگران فقدان افشای را می نامند. فایننشال تایمز
5.2 در سطح استقرار / ورود
-
منطقه و منبع انرژی را با دقت انتخاب کنید: مناطق مرکز داده را با ظرفیت شبکه خوب، سطح برق مطلوب، مخلوط تجدید پذیر قوی و خطر کم محدودیت انتخاب کنید.
-
بهینه سازی زمان بندی: برای کارهای سنگین (کارهای فروش، آموزش مدل)، برنامه ریزی در طول ساعات دور و یا زمانی که هزینه برق پایین تر است. از تفاوت های منطقه ای در هزینه / زمان استفاده کنید.
-
ارزیابی قدرت و طراحی معماری: اندازه گیری نه تنها زمان، بلکه انرژی مصرف شده (kWh) در هر معیار. بهینه سازی انرژی در نتیجه نه تنها برای سرعت خام.
-
خنک کننده و بهبود بهره وری: برای استقرار های درون لبه یا لبه، خنک کننده با کارایی بالا، احتراق مایع، تجارت شکاف قفسه، انتخاب سرور برای کارآیی انرژی را در نظر بگیرید.
-
کشف گزینه های هیبریدی / لبه: در سناریوهایی که مراکز داده ابری ممکن است با محدودیت ها یا هزینه های بالاتر مواجه شوند، محاسبه محلی یا لبه ممکن است یک معامله بهتر باشد.
خطرات و چشم انداز
6. اگر رشد بدون کنترل ادامه یابد چه؟
-
تحلیلگران کلیدی هشدار می دهند کمبود ظرفیت شبکهبه ویژه در مناطق دارای قدرت. برآورد مورگان استنلی از 20٪ کمبود در قدرت داده محور ایالات متحده از 2028 یک شاخص هوشیار کننده است. Yahoo Finance
-
اگر قدرت محدود باقی بماند، خطرات بالقوه شامل:
-
هزینه عملیاتی بالاتر (افزایش قیمت برق)
-
-
زمان های طولانی تر برای استقرار داده محور
-
محدودیت ها یا محدودیت های مکرر در کارهای محاسباتی
-
گسترش آهسته تر زیرساخت های AI (قرارداد برای افزایش انتظارات رشد)
-
احتمالاً اگر از سوخت های فسیلی برای پر کردن شکاف ها استفاده می شود، بیشتر است.
6.2 دیدگاه های مثبت / اهرم برای تغییر
-
بهره وری: حتی زمانی که تقاضای محاسبه افزایش می یابد، بهبود در معماری تراشه، خنک سازی و زمان بندی کار می تواند رشد قدرت متوسط را افزایش دهد.
-
ساخت انرژی های تجدید پذیر و هسته ای: برخی از شرکت های بزرگ فناوری در حال حاضر قراردادهای خرید برق را با انرژی های تجدید پذیر هسته ای یا بزرگ امضا می کنند. به عنوان مثال، برخی از مراکز داده با گیاهان هسته ای احیا شده برای پاسخگویی به تقاضا جفت می شوند. لیدی
-
ادغام شبکه هوشمند: داده ها ممکن است بارهای انعطاف پذیر شوند، تغییر محاسبه تا زمانی که قدرت ارزان یا تجدید پذیر است (پاسخ تقاضا).
-
متریک ها و شفافیت: به عنوان ذینفعان (دولت ها، سرمایه گذاران، جوامع) سوال های بیشتری می پرسند، مراکز داده احتمالاً معیارهای انرژی / انرژی بیشتری را منتشر می کنند – برنامه ریزی و معیار دقیق تر را امکان پذیر می کنند.
اقدامات توصیه شده برای شما و مخاطبان شما
با توجه به علاقه و کار خود را در ارزیابی، مجازی سازی، بسته بندی، محتوای جامعه IT، در اینجا اقدامات خاص شما ممکن است در نظر بگیرید:
-
شامل یک برآورد انرژی در گزارش های معیاری شما
-
هنگامی که شما معیارهای GPU/CPU را اجرا می کنید، نه تنها "زمان" بلکه "انرژی مصرف شده (kWh)" و محاسبه "GFLOPS در هر کیلووات ساعت" یا اندازه گیری بهره وری مشابه.
-
ابرها و مناطق مختلف را نه تنها با هزینه بلکه بر روی کارایی انرژی مقایسه کنید.
-
-
نوشتن محتوا برای سایت / Forum
-
یک مقاله یا یک سری با عنوان "هزینه انرژی محاسبه ابری: آنچه هر IT pro باید بداند" - محدودیت های قدرت پروفایل، استرس شبکه منطقه ای، نگرانی های خنک کننده، خطر هزینه.
-
-
ارائه یک راهنمای برای "منطقه ابر انتخاب شده توسط قدرت و عملکرد" که مکمل دیگر محتوای متمرکز بر عملکرد / مجازی شما است.
-
مجازی سازی و استفاده ترکیبی
-
بررسی کنید که چگونه GPU / CPU off-load را محاسبه کنید ( GPU شما با GTX 770 + Quadro K420 و غیره) در مقایسه با استفاده از یک خوشه ابر در مقیاس بالا در یک منطقه محدود مقایسه می شود.
-
انتشار پرونده و یا ابزار سازی (به عنوان مثال، Power Profiler، Plug-in برای اندازه گیری انرژی خوشه GPU) برای جامعه شما.
-
-
ملاحظات بسته بندی و استقرار
-
هنگام طراحی ماژول ها / پلاگین ها / برنامه ها (به عنوان مثال، ماژول های جوملا، برنامه های معیار GPU / AI)، گزینه های “eco-mode” را اضافه کنید: به عنوان مثال، شغل های برنامه ریزی در طول ساعت های خارج از حد و خم برای جذب قدرت پایین تر، معیارهای جذب قدرت.
-
-
برای مجازی سازی (VMware/VirtualBox و غیره)، بهترین تمرین ها را برای کاهش قدرت، به عنوان مثال، اجتناب از نظارت بیش از حد، تحکیم حجم کار بیکار، فعال کردن خنک کننده / میزبان قدرت مهارت.
-
مشارکت با شفافیت ارائه دهندگان ابر
-
پیگیری کنید که ارائه دهندگان ابر / داده محور معیارهای انتشار (PUE، مخلوط انرژی، استفاده از آب) را منتشر می کنند و آنها را در محتوای شما برجسته می کنند.
-
اعضای جامعه را تشویق کنید تا بپرسند: «منبع انرژی این منطقه چیست؟ ظرفیت شبکه یدکی چیست؟ آیا سهمیه قدرت / ریسک های کاهشی وجود دارد؟ ""
-
نتیجه گیری
هزینه پنهان ابر و AI فقط دلار پرداخت شده در هزینه های اشتراک نیست - آن را افزایش سریع قدرت و بار زیرساخت این در پشت همه این "چرخه های درونی" قرار دارد. دیتا-محورها دیگر اتاق های پشتی منفعل اینترنت نیستند؛ آنها هستند مشتریان در مقیاس صنعتی رشد آنها پیامدهای گسترده ای برای خدمات، شبکه ها، خانواده ها، صنایع، محیط زیست و برای حرفه ای های IT مانند خودتان دارد.
بحران (یا شاید چالش) واقعی است: تقاضای رو به رشد، عرضه محدود، شبکه های پیری، خنک کننده و بار زیست محیطی همه به نیاز برای نیاز به برنامه ریزی مسئولانه تر, استقرار منطقه آگاه, معماری انرژی کارآمدو معیارهای شفاف... برای هر کسی که کارهای سنگین انجام می دهد - معیار GPU/CPU، مجازی سازی، ماژول های بسته بندی، استقرار ابر - این بعد دیگر نمی تواند نادیده گرفته شود.


11320
IT Pro 



















