Суміш Експертів: Роздуми про Штучний Інтелект – Від Kimi K2 до Енергетичного Повороту
Зібралася я біля екрану, передчуваючи захопливий епізод “Суміші Експертів”. Тім Хван, як завжди, зібрав блискучу команду, щоб розібратися зі світом штучного інтелекту. І ось, воно почалося – епізод, сповнений роздумів, сумнівів та захоплення.
Серед запрошених:
- Абрахам Деніелс, старший технічний менеджер по продукту для Granite.
- Каутар Ель Маграві, головний науковий співробітник і менеджер з гібридного хмарного ШІ.
- Кріс Хей, видатний інженер.
Першим на порядку денному стало обговорення Kimi K2, нової моделі, яка швидко набуває популярності.
Kimi K2: Справжній прорив чи піар-кампанія?
Вибух у світі ШІ часто супроводжується надмірним ажіотажем. І отже, Тім Хван поставив питання про Kimi K2: переоцінена вона чи недооцінена?
Абрахам, обережно, зауважив: “Ще зарано судити. З погляду бенчмарків – вражаюче. Але потрібні реальні приклади, щоб зрозуміти, чи дійсно вона така гарна, як про неї говорять”.
Кріс підтримав скептицизм, зауваживши, що, незважаючи на вражаючі показники, Kimi K2 все ще не перевершує Claude. Він пояснив: “Вона, безперечно, найкраща модель з відкритим кодом на даний момент. Але вона не може зрівнятися з Claude, особливо в кодуванні.” Він відзначив її чудові здібності до планування та використання інструментів, що робить її багатообіцяючою для майбутніх агентів ШІ, але звернув увагу на відсутність розвинених здібностей до міркувань.
Каутар, хоч і визнала модель гарною, вважала, що навколо неї багато галасу. Вона порушила важливий аспект – боротьбу за ціною між відкритим кодом та комерційними API. Каутар наголосила, що вартість переходить від дорогих API до фіксованих витрат на інфраструктуру, що дає компаніям можливість використовувати гібридну стратегію: дорогі, комерційні моделі для найскладніших завдань та дешеві, власні, моделі з відкритим кодом для основної роботи. Така стратегія може створити тиск на цінову політику найбільших гравців, таких як OpenAI та Google. За словами Каутар, успіх Kimi K2 показує, що битва у сфері штучного інтелекту зміщується від чистої гонки продуктивності до гонки економічної ефективності та стратегічного контролю.
Цікаву деталь підмітив Тім – потенційні проблеми з конкуренцією. Навіть якщо Kimi K2 перевершить інші моделі в кодуванні, їй буде важко здобути популярність, оскільки багато платформ та кінцевих точок вже використовують існуючі комерційні моделі.
Абрахам доповнив, що справа не в тому, чи модель краща, а в економіці. “Наскільки справедливою буде ціна з точки зору наших бізнес-цілей та користувацької бази?” Він вказав на роль відкритого коду як стратегічної зброї, що посилює конкуренцію та знижує залежність від окремого постачальника.
Шість Місяців Після R1: Що Змінилося?
У епізоді згадали про шосту річницю від запуску R1, що змусило мене згадати про те, як швидко розвивається світ ШІ.
Під час обговорення з’ясувалося, що OpenAI відклала запуск моделі з відкритим кодом, що спочатку розглядалося як відповідь на китайські моделі. Кріс висловив припущення: “Американські компанії не зовсім відповіли на виклик відкритого коду”. Він також вказав на те, що економіка та зміна влади впливають на ситуацію.
Кріс наголосив на важливості малих моделей, особливо для агентів. Google та IBM є єдиними американськими компаніями, які, на його погляд, досягли успіху з відкритим кодом, але він хотів би більшого. Кріс підкреслив, що конкурентоспроможні моделі, як-от в кодуванні, можуть вплинути на бізнес-модель інших компаній.
Каутар звернула увагу на те, що DeepSeek на даний момент лідирує серед моделей з відкритим кодом. Вона пояснила, що їх найбільше досягнення – в ефективності, зокрема, в архітектурних рішеннях. Каутар проаналізувала, що ключ до успіху – у поєднанні найкращих показників з економічною ефективністю.
З її слів, хоча DeepSeek покращив свої показники, вони не змогли суттєво змінити ринок. Впровадження DeepSeek в промисловість обмежене через нормативні вимоги та програмні обмеження. Використання зосереджено у стартапах і хобі-спільнотах у Китаї. Каутар вважає, що в США та Європі, впровадження в бізнес все ще обмежене, хоча в академічних та спеціалізованих сферах є велика підтримка. Каутар пояснила, що це може бути частиною геополітичної гри в сфері ШІ.
Тім зазначив, що спочатку всі думали, що R1 створить проблеми для американських компаній, але так не сталося. Абрахам додав, що статус-кво змінився, і метою стало зниження вартості використання. Він також відзначив, що безпека та оркестрація агентів стали пріоритетом.
Кріс торкнувся питання ефективності та її важливості для успіху. Він підкреслив креативність команди Kimi K2, яка вперше запропонувала новий оптимізатор, а DeepSeek V3 – RL-потік. Він вважає, що відкритий код може сприяти творчості, але великим корпораціям може бути складно зосередитись на ефективності через великі ресурси, якими вони володіють.
Енергія як Нове Вузьке Місце?
Обговорення перейшло до оголошення Google про інвестиції у 25 мільярдів доларів в енергетичну інфраструктуру.
Абрахам зауважив, що Google вибрала унікальний підхід, інвестуючи як у дата-центри, так і у відповідну інфраструктуру. “Це більш цілісний підхід”, – сказав він. Абрахам вважає, що Google оцінює вплив дата-центрів на навколишнє середовище та громади, що є великим кроком.
Він також згадав про ядерну енергію, натякнувши, що наступним кроком буде вивчення різних джерел енергії, оскільки до 2030 року потреба дата-центрів може скласти від 1% до 3% всієї енергії. Абрахам підкреслив, що це вже перетворюється на гонку в енергетичній галузі.
Каутар підтримала цю точку зору, зазначивши, що перехід від дефіциту чіпів до дефіциту енергії означає, що інфраструктура та стабільне електропостачання стають новими ключовими факторами. Вона додала, що часи очікування на під’єднання до електромережі сягають кількох років, що тисне на кліматичні цілі.
Кріс запропонував оцінити наслідки. Він згадав про “ефект Патріка Махоумса”, тобто велику кількість хороших, але не видатних ІІ, в порівнянні з революційними моделями. Він вважає, що тільки найвищі результати здатні зруйнувати домінуюче становище OpenAI.
Каутар звернула увагу на те, що Google стає лідером у закупівлі відновлюваної енергії. Вона підкреслила, що енергія стає базою для майбутнього ІІ. Вона виразила стурбованість, що це може збільшити розрив між багатими та бідними.
ШІ прискорює науку: Ключ від Лоуренса Ліверморської національної лабораторії
Наприкінці епізоду оголосили про те, що Lawrence Livermore National Laboratory розширює використання Claude на всю лабораторію, залучаючи 10,000 вчених. Дослідники будуть використовувати його для аналізу даних, генерування гіпотез та дослідження нових напрямків.
Абрахам сказав: “На мою думку, це вже відбувається”. Він уточнив, що це стане ще одним свідченням сили екосистеми.
Кріс висловив надію, що вчені мають достатні інструменти для своєї роботи.
Каутар підкреслила, що наука має потенціал до серйозних проривів.
Обговорення показало, що ШІ, швидше за все, змінить традиційні процеси наукових досліджень, сприяючи міждисциплінарним підходам.
Наприкінці, Тім Хван подякував усім учасникам та слухачам, пообіцявши зустріч у наступному епізоді.
Відчуваю прилив натхнення, розмірковуючи над почутим. Суміш експертів вкотре подарувала мені глибокі роздуми про те, як штучний інтелект формує наш світ, від етичних дилем до захопливої гонки за інноваціями. Цього разу мене найбільше зачепила тема енергії – щось таке буденне та фундаментальне, але зараз життєво необхідне для прогресу. Десь там, поміж рядків, я почула, як шепочуть голоси майбутнього… І знаєте, я відчуваю, що ми тільки на початку цього захопливого шляху.