במהלך העשור האחרון, ארכיטקטורות ענן hyperscale התמקדו בציי שרת x86 הצפויים להתאמה אישית. העידן הזה נגמר. עם AI, מודלים של בסיס, סימולציה וניתוח מואץ עכשיו לצרוך כמויות חסרות תקדים של compute, Hyperscalers עוברים במהירות לכיוון אדריכלות GPU-ראשון - שבו יחידות עיבוד גרפיקה, מאיצים וסיליקון מותאם אישית אינם תוספות משניות, אבל המנועים העיקריים של compute.
מעבר זה מעצב מחדש את תכנון מרכזי הנתונים, הכלכלה, שרשרת האספקה ומערכות אקולוגיות התוכנה בקנה מידה עולמי. הנה איך Hyperscalers מתכוננים לעתיד ראשון GPU, ומה זה אומר לשאר התעשייה.

Redesigning Datacenters for High-Density GPU Clusters
מבחינה היסטורית, צריפים הונדסו סביב תרמילים CPU - לעתים רחוקות מעל 8-12 קילוואט לכל צריף.
קובצי AI מודרניים עולים 30 קילוואט, 60 קילוואט ואפילו 100+ קילוואט לכל צריף.
Hyperscalers מגיבים:
קירור נוזלי כהגנה
-
לולאות צלחת קרות של GPU
-
החלפת חום דלת אחורית לציים היברידיים
-
תשתיות מים
-
יחידות הפצה קוליות (CDUs) בעיצובים ברמת שורות
High-Density Pods
-
שורות GPU בלבד עם סידור תרמי קפדני
-
המונחים: airflows
-
כוח וקירור עצמאים של אולמות תואמים למטרות כלליות
תכנון יכולת תרמית-מודע
קובצי AI מניעים כעת בחירת האתרלא CPUs
כושר קירור קובע:
-
כמה GPUs ניתן לפרוס
-
היכן ניתן להציב
-
כמה מהר אשכולות יכולים לעלות
פיתוח נתונים Power Delivery
rack יחיד של מאיצים AI יכול לצייר 50+ קילוואטגורם ללחץ מסיבי על תשתיות כוח.
Hyperscalers מגיבים על ידי:
בסביבה הקרובה של Substation-adjacent Campus
כדי להבטיח זמינות רב-hundred-MW עבור קיבולת GPU.
שימוש כבד בהפצה של HV
המפעילים מוסיפים:
-
110 kV - 230 kV Incoming Feeds
-
תחנות מעבר מתקדמות
-
עיצוב רשת
תגית: + throttling
אשכולות GPU כפופים:
-
כוח דינמי,
-
המונחים:
-
המונחים:
-
ואפילו פינוי מבוסס תרמי.
GPU אסטרטגי המונחים: Silicon Pipelines
החזית החדשה היא אספקת סיליקון.
GPU Pre-Purchasing
Hyperscalers עכשיו להציב פקודות 12-24 חודשים מראשהבטחת:
-
NVIDIA אשכולות H-Series,
-
AMD Instinct
-
אינטל גאודי,
-
וקווי מאיץ מתעוררים.
אסטרטגיה Multi-Vendor
אף אחד לא נמצא בספק אחד.
Hyperscalers עכשיו באופן שגרתי:
-
לערבב ספקים על פני אשכולות,
-
לאמץ מאיצים מיוחדים למשימה,
-
להעריך את העלות-per-token לעומת עלות-per-FLOP לעומת עלות-per-וואט.
תוכניות אנטישמיות
כולם בונים שבבים משלהם:
-
Google TPU
-
AWS Trainium & Inferentia
-
Microsoft Maia
-
MTIA
GPU-First לא תמיד מתכוון GPU-Only.
זה אומר מואץ ראשון.
מותגים: GPU Megaclusters
GPUs רק ביצועים טובים כאשר הם יכולים לתקשר בכבדות נמוכה רוחב פס גבוה.
Hyperscalers משקיעים:
Mass-Scale HPC-Style
-
800G - 1.6T מעברים
-
התנצלות מלאכותית
-
המונחים: aware routing
קיצור של Ultra-large
Clusters פורשים:
-
אלפי צללים,
-
עשרות אלפי GPUs
-
ניהול בד מתואמת
הפעלת מטוס בקרת הרשת
כולל:
-
סיווג תעבורת AI,
-
תחזית רוחב פס ברמה גבוהה,
-
תרמית + כוח + רשת inter תלות מודלים.
רשת היא כעת צוואר בקבוק.
Hyperscalers תוקף אותו באופן אגרסיבי.
תוכנה & Scheduling טרנספורמציה
השינוי אינו רק חומרה.
המודל המבצעי נכתב מחדש.
GPU-Aware לוחצים
לוח הזמנים להסתגל:
-
פיזור זיכרון GPU
-
מקבילות
-
Multi-GPU Replication
-
מודל תבניות
הקצאה דינמית לעומת הזמנה
GPUs נע בין:
-
אימונים,
-
עומסי עבודה,
-
המונחים:
-
צינורות
לעתים קרובות דקות דקות.
Runtime & פלטפורמה סטנדרטיזציה
Hyperscalers עקבו אחרי:
-
PyTorch כבסיס
-
CUDA/XLA/ROCm Toolchains
-
ערימה של נהגים וגרעין
cohesion התוכנה הוא קריטי כדי לדרג מאיצים ביעילות.
AI-Focusing Cluster תפעול
ענן GPU דורש מומחיות חדשה, כולל:
תזמון משימות טמפרטורה
העבודה מבוססת על:
-
קירור ביצועים
-
תנאי מזג אוויר חיצוניים
-
אותות תמחור
פיצוץ טלמטרי
Hyperscalers אוספים כעת:
-
מפות תרמיות GPU
-
מידע על אנרגיה
-
שימוש ברשת בזמן אמת
-
יעילות מודלים
-
דירוג בריאות הלולאה
תחזוקה חיזוי (AI-assisted)
שימוש ב-ML ל-Pre-detect:
-
הסתברות
-
השפלה
-
אובדן יעילות קר
-
הזדקנות תרמית
-
מצבי כישלון NIC
צוותי GPU הופכים להיות מיוחדים כמו מהנדסי HPC.
אסטרטגיה עסקית וכלכלה ראשונה
השינוי הזה אינו זול.
Hyperscalers הורסים את המודלים הפיננסיים שלהם סביב:
CapEx Megacycles
מיליארדים תקציבים:
-
בינה מלאכותית,
-
התרחבות גבוהה,
-
ומחויבות סיליקון
אסטרטגיות GPU
כולל:
-
AI אימון SKUs
-
המונחים: tiers
-
המונחים:
-
אתר GPUs
-
GPU "אזורים בתוך אזורים"
מיקום עולמי
לא כל אזור יכול לתמוך בצפיפות GPU.
ציפיות:
-
אזורים ראשונים
-
אזורים ראשונים
-
המונחים:
הכנת כוח העבודה
Hyperscalers לא יכול להגדיל את תשתית GPU ללא שינוי יכולות כוח העבודה.
ציפיות:
-
יותר מהנדסי HPC מאי פעם
-
רשת מוגבלת + compute + קירור מומחים
-
אנליסטים
-
מהנדסי פיזיקה Cluster
-
מתכנן אספקה הסיליקון
-
מנהל תכנית Fab-partnership
השינוי הזה כבר מתנהל.
הדרך עד 2026–2028
בין השנים האחרונות ל-2020, מצפים מהיפרקליירים:
-
לבנות עוד GPU-optimized Megacampuses
-
להשקיע מספר צינורות סיליקון
-
המונחים אחסון exabyte מחסומים AI
-
קירור Evolve מהאוויר הראשון - נוזל היברידי
-
סטנדרטיזציה שירותי ענן מצטברים
-
היכרות יותר ויותר סביבות אימון אוטומטיות
-
הרחבת היצע הענן ה- GPU הפרטי
GPU- הראשון הוא לא מגמה זמנית.
זהו המרכז האדריכלי החדש של הכבידה.
מסקנה
Hyperscalers מתכוננים לעומסי עבודה GPU-First בכל שכבת אדריכלות - מ-סיליקון מיקור ועד עיצוב מרכזי נתונים, בדים ברשת, קירור להתנצלות, ערימות תוכנה, תזמון אשכול ותכנון יכולת גלובלי.
השינוי הזה עמוק:
-
CPUs הופכים להיות פעולת התמיכה
-
GPUs ו מאיצים הם הכוכבים
-
בינה מלאכותית מעצבת תשתיות מהקרקע
החברות ששולטות במעבר זה יגדירו את העשור הבא של מחשוב ענן, הכשרת מודלים וכלכלה גלובלית.
עידן ה-GPU החל.
יתר על כן, הם מירוצים לשלוט בו.


10707
IT Pro 



















