Серце Штучного Інтелекту: Як в Оклахомі створюють найшвидший суперкомп’ютер світу
Ви коли-небудь задумувались, що відбувається “під капотом”, коли звертаєтесь до AI-чату? Ми звикли спостерігати дивовижну магію – миттєві відповіді, які з’являються ніби з нізвідки. Але за цим стоїть справжнє інженерне диво, гігантська, надскладна система, яка працює на межі людських можливостей. Минулого тижня мені випала нагода зазирнути за куліси одного з таких місць – справжньої “фабрики ШІ” в Оклахомі, котра обіцяє змінити правила гри.
Серед безкрайніх прерій височить скромна бетонна будівля. Зовні вона може здаватись звичайною, але всередині вирує справжнє пекло, або, точніше, рай для швидкості. Це – новий дата-центр Cerebras, який вже зараз обслуговує своїх клієнтів з потужністю 44 екзафлопси. Це – найшвидша AI-інфраструктура на планеті. Сьогодні ми не просто оглянемо її ззовні – нас чекає екскурсія, розмова з генеральним директором та спроба розгадати секрет створення цього титана. Це – подорож у саму суть штучного інтелекту.
Місце народження швидкості: Чому саме Оклахома?
“Насамперед, дякую, Ендрю, що погодилися прийняти нас”, – розпочав я, оглядаючи простір. “Ми знаходимось у вашому новому дата-центрі Cerebras в Оклахомі. Чому саме це місце було обрано?”
Ендрю, генеральний директор Cerebras, усміхнувся: “Існує багато факторів, які треба враховувати у виборі локації. Шукаєш місце з помірними витратами на робочу силу, де можна будувати та розширюватись, а також з відносно недорогою енергією. І знаєте, ми знайшли все це тут, в Оклахома-Сіті”.
Але справа не лише в ціні. Оклахома має свою специфіку, що вплинуло навіть на архітектуру будівлі. “Дизайн будівлі формувався з огляду на місцеву погоду”, – зауважив я, роздивляючись міцні бетонні стіни.
“Вірно”, – підтвердив Ендрю. “Обираючи місце, треба враховувати енергетичний мікс, так? А також безпеку дата-центру. Оклахома відома своїми торнадо. Як ви це враховуєте?”
“Це важливе питання. Передусім, це стосується конструкції будівлі та її сертифікації. Ваш страховик перевіряє будівлю та переконується, що вона відповідає стандартам безпеки для можливих стихійних лих, характерних для цього регіону. Якщо у вас дата-центр у Санта-Кларі, Каліфорнія, він сертифікований та готовий до землетрусів. Наш об’єкт – це бетонна споруда, яка витримує торнадо”.
Здавалося б, така дрібниця, як погода, але вона визначає фундамент, буквально. Це як будувати оселю в Карпатах – потрібно враховувати сніг, вітер та міцність стін. Тут, в Оклахомі, враховували вітер, але масштаби зовсім інші.
Серце титана: Wafer Scale Engine – чіп розміром з тарілку
Швидкість, яку ми бачимо, народжується з радикальної ідеї: Wafer Scale Engine – найбільший процесор, коли-небудь створений.
“Наскільки великий звичайний чіп у порівнянні з тим, що ми бачимо тут?” – запитав я, підходячи ближче до однієї з систем.
“Це цікаво”, – почав Ендрю. “Площа цього чіпа – 46 250 квадратних міліметрів. Для тих, хто не в метричній системі – це розмір вечерньої тарілки! Звичайний чіп вважався великим, якщо його площа перевищувала 750 квадратних міліметрів. Тобто, наш – це вечерня тарілка, а найбільші інші чіпи – розміром з поштову марку або приблизно з ваш ніготь”.
Лише уявіть! Це як порівнювати крихітну фішку з комп’ютерної гри з повною картою настільної гри.
“Кожна система має один такий чіп. Він розташований за блоками живлення та стоїть вертикально”, – Ендрю показав на велику металеву панель. “Зазвичай чіпи розміщують на материнських платах ось так”, – він вказав на типовий комп’ютерний компонент, – “А ми ставимо його вертикально, приблизно на половині глибини”.
“Зрозуміло”, – кивнув я.
“А з іншого боку – він охолоджується”.
Як їм вдається бути такими швидкими? Магія без затримок
Прорив полягав не лише у розмірі. Вся суть у тому, що пам’ять розташована на самому чіпі. Це усунуло затримку між процесором та пам’яттю, яка сповільнює традиційні GPU під час інференсу (тобто, коли ШІ аналізує дані та робить висновки).
“Ми маємо всю пам’ять на чіпі”, – пояснив Ендрю.
“А інші мають пам’ять поза чіпом?” – уточнив я.
“Саме так. І ця затримка між ними – причина, чому GPU повільні в інференсі”.
“Зрозуміло”, – відповів я, відчуваючи, як деталі складаються в єдину картину. “Тобто, ваша система в 2,5 тисячі разів швидша в доступі до даних та їх використанні?”
“Так, приблизно. Це дає нам колосальну перевагу у продуктивності. Це магія пам’яті. “
Це як мати холодильник прямо біля плити, а не ходити до комори за кожним інгредієнтом. Коли все під рукою, готуєш набагато швидше!
Охолодження як мистецтво: Рідкісні системи та Delta T
Один такий гігантський чіп потребує 18 кіловатів. Помножте це на десятки, сотні таких систем. Виникає питання: як все це охолодити? Cerebras обрала рідинне охолодження ще у 2017 році.
“Це машини з водяним охолодженням, тому вони неймовірно енергоефективні”, – зазначив він. “Бачите синю лінію? Це холодна вода, що надходить. Червона – тепла, що виходить. А те, що ви бачите знизу – це як облаштовані сучасні дата-центри: під піднятою підлогою. Вся водна інфраструктура знаходиться там. І ось ви можете побачити зворотний потік охолодженої води”.
“Так, зрозуміло. Холодна вода, клапани від компанії Bimo, яка надає нам дані про тиск та інші деталі, щоб ми могли все відстежувати”.
Усе це підключено до величезної установки на 6000 тонн, що контролює температуру та вологість, щоб чіпи постійно перебували у своїй “зоні комфорту”.
“Ми тут з Біллі, операційним директором Scale Data Centers”, – продовжив Ендрю, представляючи колегу. “Розкажіть, будь ласка, що ми бачимо та як відбувається охолодження води?”
“Це агрегат на 6000 тонн з рідинним охолодженням, який постачає охолоджену воду до серверів Cerebras”, – пояснив Біллі. “У нас є місце для розширення ще на 6000 тонн. Якщо Cerebras розвиватиметься, наші чиллери теж зростатимуть. Ми подаємо воду з температурою приблизно 5,5 degreesC. Вони її використовують, ми її нагріваємо через теплообмінники до приблизно 21 degreesC, і саме її постачаємо до чіпа. Потім вона повертається. Ззовні є охолоджувальні вежі, які забирають тепло шляхом випаровування його в повітря. Ось такий великий цикл”.
“А чому ви її нагріваєте перед подачею до чіпів?” – це було несподіване питання.
“Це робить чіпи ефективнішими. Вони не можуть працювати з такою холодною водою, тому що при досягненні точки роси у серверах з’являється волога – конденсат. Ми мусимо тримати різницю температур (delta t) близько 15 градусів, щоб уникнути вологи в серверах”.
“І яка техніка фактично охолоджує воду в цих машинах?”
“Самі чиллери охолоджують конденсовану воду. Чиллер сам створює охолодження”.
“Ось тут ви добре бачите температуру води на вході та на виході”, – додав Ендрю, вказуючи на монітор. “Ми можемо відстежувати це для кожного компонента”.
Енергія для гігантів: Безперебійна робота суперкомп’ютера
Високошвидкісні обчислення вимагають стабільного живлення. Основне джерело тут – природний газ, перероблений на електрику. Акумулятори забезпечують п’ять хвилин роботи, поки не ввімкнуться дизель-генератори потужністю 3 мегавати.
“Це 3-мегаватний генератор”, – показав мені наш гід. “Працює на дизелі або зрідженому природному газі. Це один з генераторів, що живлять кімнату, яку ви щойно бачили”.
“Тобто, це резервний генератор, чи він зараз використовується для живлення?” – запитав я.
“Це резервний генератор. Він вмикається, якщо основне джерело живлення виходить з ладу”.
“А яке основне джерело?”
“Основне джерело – це природний газ, який перетворюється на електрику. А потім подається до кімнати”.
“Це неймовірно! І, здається, хтось із ваших колег казав, що таких генераторів у всій Оклахомі лише чотири?”
“Так, це справжні гіганти. Ці генератори дивовижні. Ось як ми досягаємо майже ідеального аптайму – маємо ці машини. Якщо раптом станеться збій живлення, з будь-якої причини, вони увімкнуться миттєво, без жодних перерв”.
“Між ними є резервне живлення від батарей?” – уточнив я.
“Так, система резервного живлення працює так: спочатку вмикаються батареї, які дають вам близько п’яти хвилин. Якщо щось виходить з ладу, батареї задіюються негайно, ще до увімкнення генератора. Генератору потрібно близько п’яти хвилин, зазвичай три, але ми закладаємо п’ять, щоб запуститися. І тоді цей красень вже постачає всю необхідну потужність, і ви залишаєтеся онлайн”.
“І їх три таких?”
“Кожен із них – 3 мегавати. Отже, ми маємо живлення, що надходить різними лініями, залежно від потреби. Один, два або три з них вмикаються для кімнати, яку ви щойно бачили”.
“Дивно, бо коли я спілкуюся з іншими розробниками AI-фабрик, вони говорять про гігавати потужності, але мають на увазі споживання енергії, а не вихідну потужність інференсу”.
“Вірно. Гігавати – це спосіб описати потужність усієї будівлі. Скільки енергії ми можемо подати до всієї обчислювальної системи. Ніхто сьогодні не має гігаватів потужності. Це все ще мрії майбутнього, розумієте? Це, я б сказав, один із топ-50 таких об’єктів у світі. Є більші, але мало хто настільки ефективний”.
“Я зрозумів. Енергія – це вхід, обчислення – це вихід. Ви говорите про вихід, чому інші говорять про вхід? Саме тому, що ви настільки ефективніші?”
“Так, тому що наші показники виглядають краще, якщо говорити про вихід. Все просто”.
Другий зал: Ще більше потужності для майбутнього
“До цього моменту ми бачили OKC1, перший дата-хол, – розповів мені Ендрю, – він вже працює в продакшені. Те, що ми збираємося побачити зараз – це OKC2, другий дата-хол, який буде запущено за три-чотири тижні”.
“Ого, тут вже значна частина роботи зроблена?” – вигукнув я, заходячи до наступної величезної кімнати.
“Так. В процесі будівництва ми спочатку встановлюємо стійки та кабелі. Це перший крок. Потім все розставляється однаково. І ось, другий крок – встановлення машин”.
“Коли ці машини будуть запущені, наскільки більшою буде обчислювальна потужність?”
“Ця кімната додасть близько 20 екзафлопс. Це приблизно в 10 разів більше, ніж найбільший комп’ютер, яким володіє Міністерство енергетики США”.
Збудовано вдома: Чому США?
Системи виробляються та збираються в Малібу, Каліфорнія, що зберігає промисловий ланцюжок всередині країни.
“Ви вирішили будувати в Сполучених Штатах, як ви казали, що модульні блоки Cerebras виробляються тут. Чому ви зробили такий вибір? Що це вам дає?” – запитав я.
“Ми виробляємо в Малібу, Каліфорнія. Ми прагнемо виробництва в США. Ми пакуємо, збираємо. Фінальні системи, які ви бачили, виробляються в США. Ми вважаємо, що це важлива частина нашої відповідальності як учасника цієї економіки”.
Це приємно чути. Іноді здається, що все виробництво переїхало кудись далеко, але ось вам приклад, що й удома можна створювати неймовірні речі.
Найважче випробування: Коли здавалось, що все втрачено
“Десять років тому вся система, апаратне та програмне забезпечення, була лише ідеєю”, – поділився Ендрю. “Команда пройшла через період, коли здавалося, що це неможливо. Був період, 15-18 місяців, коли ми нічого не могли зробити. Ми витрачали 8 мільйонів доларів на місяць, і проблема не вирішувалась”.
“Вау”, – видихнув я. “Це багато грошей”.
“Так, це дуже багато. І наша рада директорів залишалася з нами. Ми використовували добру інженерну методологію. Кожну помилку аналізували, щоб зрозуміти, що потрібно зробити, аби її не повторити. Але ми знову припускалися помилок. Натикалися на щось нове. І знову, і знову. А потім, одного дня, ми все налаштували, і це запрацювало”.
“І де це було?”
“Ми стояли в лабораторії розміром з невеликий офіс, у будівлі, яка навіть не була призначена для апаратного забезпечення. Вікна були відчинені, ми просвердлили дірку в стіні, щоб вивести гаряче повітря. І ми, п’ятеро засновників, стояли там 30 хвилин, не могли говорити. Ми розв’язали проблему, яку найкращі у світі протягом 75 років не могли вирішити”.
Це історія про наполегливість, про віру в мрію, навіть коли все навколо каже “ні”. Це те, що рухає прогрес.
Що далі? Медицина, освіта та майбутнє ШІ
“Ми очікуємо найшвидших змін у медицині та освіті”, – сказав Ендрю. “Це сфери, які давно потребують змін і безпосередньо виграють від швидших, точніших моделей”.
“В якому аспекті суспільних змін через ШІ ви персонально найбільше зацікавлені?” – запитав я.
“Я думаю, що ШІ має величезний потенціал у медицині. Частково тому, що наші попередні методи були досить рудиментарними. Я вважаю, ми зможемо скоротити процес розробки ліків на роки. Сьогодні це займає 17-19 років, щоб розробити ліки з нуля. Ми повинні змогти зменшити цей термін до менше 10 років. Також мене захоплює освіта. Багато в чому спосіб, яким ми навчаємо дітей, не змінювався з часів, коли Аристотель навчав Александра Македонського. ШІ пропонує зовсім іншу можливість змінити те, як ми навчаємо дітей”.
“Ендрю, велика вам подяка. Вітаю з усім, і я з нетерпінням чекаю, як це все продовжуватиме розвиватися”.
“Дякую, що завітали”.
Підсумовуючи, ми побачили не просто дата-центр. Ми зазирнули у серце інновацій, де інженерна думка, наполегливість та сміливість роблять неможливе можливим. Cerebras не просто будує найшвидшу AI-інфраструктуру на Землі. Вони створюють інструменти, які здатні змінити наше життя – від лікування хвороб до навчання наступних поколінь.
Як результат, майбутнє штучного інтелекту будується прямо зараз, у таких несподіваних місцях, як Оклахома. І це майбутнє обіцяє бути надзвичайно швидким, потужним і, сподіваємося, спрямованим на благо людства.
Що далі? Не бійтеся заглядати за лаштунки. Технології – це не лише складні коди та схеми. Це історії людей, їхніх мрій та їхньої здатності перетворювати складне на диво. Слідкуйте за новинами від Cerebras, адже їхній вплив на світ AI тільки починається. А поки що, коли наступного разу поставите запитання AI, згадайте ці величезні сервери, рідинне охолодження та наполегливість, що робить це все можливим. Це – справжня магія прогресу!







