Туман у Сан-Франциско та шторм у Силіконовій долині: Новини AI, які варто знати
Привіт, друзі! З вами Ліла Гарт, і сьогодні я з туманного Сан-Франциско, щоб поділитися з вами найцікавішими новинами світу штучного інтелекту. Попереду у нас кілька захоплюючих історій: від корпоративних інтриг до дивних експериментів з аніме-подругами. Тож наливайте собі каву (або щось міцніше) і давайте розбиратися!
Windsurf: Коли мрії про придбання розбиваються об реальність
Почнемо з історії, яка розбурхала Силіконову долину: перипетії навколо компанії Windsurf. Якщо ви ще не чули, то Windsurf — це AI-асистент для кодування, інтегрований в IDE, подібний до Cursor. Вони навіть спонсорували цей канал! OpenAI мала намір придбати Windsurf за $3 мільярди. Вражаюча сума, чи не так? Але… угода зірвалася.
Замість цього Google перехопила близько 30 провідних співробітників Windsurf. Саму ж компанію залишили незалежною, з рештою команди. Такий розвиток подій викликав справжню бурю емоцій. Засновникам та ключовим дослідникам дістався великий куш, а решта команди, по суті, залишилася ні з чим.
Але не все так сумно, як може здатися. Згодом Cognition, команда, що стоїть за Devon, придбала решту активів та команди Windsurf. Виходить, усі у виграші? Принаймні, так виглядає на перший погляд.
Ця нова стратегія — придбання команди, а не компанії, а потім залишаючи компанію як оболонку — здається, стає новою тенденцією. Ще один приклад — Scale AI, яка придбала генерального директора Олександра Вана та низку своїх найкращих талантів, щоб керувати супеінтелектом у Meta. Майже одразу найбільші контракти Scale AI від Google та Open AI почали скасовуватись, адже хто захоче ділитися своїми даними з конкурентами, якими є Meta?
Це безперечно дуже незвичайна ситуація. Але приємно бачити, що про команду Windsurf подбали. З нетерпінням чекаю, що ж разом створять Devon та Windsurf!
Meta та Марк Цукерберг: Гонитва за супеінтелектом
Тепер перейдемо до новин від Meta та Марка Цукерберга, які зробили масштабний анонс про інвестиції у супеінтелект. Марк оголосив про створення обчислювального кластера розміром майже з Мангеттен.
«Я зосереджений на створенні найелітнішої та найталановитішої команди в галузі», — сказав Цукерберг. З огляду на ціни на ринку, суми, пропоновані провідним дослідникам, сягають сотень мільйонів доларів. У Meta буде багато грошей, щоб дозволити собі це.
Meta планує інвестувати сотні мільярдів доларів у обчислювальні потужності для будівництва супеінтелекту. За словами Semi Analysis та Ділана Патела, компанія Meta має всі шанси стати першою лабораторією, яка запустить суперкластер потужністю понад 1 гігават. Вони планують побудувати кілька кластерів, потужність першого з яких, Prometheus, буде запущена в 2026 році. Також будується “Hyperion”, що має змогу масштабуватись до 5 гігават протягом декількох років! Уявіть собі обсяги обчислювальних потужностей, які отримають дослідники!
Однак, є певні побоювання. The New York Times повідомила, що Meta може відмовитись від зусиль з відкритим вихідним кодом, що буде прикро. Компанія завжди була великим прихильником open source. Обговорюється відмова від потужної моделі штучного інтелекту з відкритим кодом на користь розробки закритої. Безумовно, було б прикро, враховуючи те, як багато Meta інвестувала в open source. Але з іншого боку, якщо ви відстаєте, має сенс інвестувати та викладати все у відкритий доступ, щоб наздогнати лідерів. Але коли ви попереду, ви не хочете цього робити.
Amazon Bedrock: Спонсорська підтримка та перехід у велику гру
Перш ніж ми продовжимо, хочу подякувати спонсору цього відео — Amazon Bedrock. Bedrock Agent Core є містком між proof of concept та production для ваших агентів, пропонуючи повний набір сервісів, розроблених для розгортання та експлуатації високопродуктивних агентів у масштабі.
Agent Core Gateway для агентів дозволяє безперебійно виявляти та безпечно підключатись до інструментів. Agent Core Memory дозволяє агентам точно зберігати довгострокову та короткострокову пам’ять. Розгортайте агентів безпечно у масштабі з agent core runtime, розробленим для динамічних навантажень на агентів, включаючи найтриваліший час сеансу в галузі для асинхронних робочих навантажень разом з agent core identity для безпечної аутентифікації агентів. Agent core також включає спостереження на основі Amazon CloudWatch, що важливо для безпечної та надійної роботи агентів.
Agent Core працює з популярними фреймворками з відкритим вихідним кодом, такими як Crew AI, Langraph, Llama Index та Strands agents. А з будь-якою моделлю розробники можуть використовувати його сервіси незалежно один від одного або разом, усуваючи компроміс між гнучкістю open source та безпекою та надійністю корпоративного рівня.
Не забудьте ознайомитися з Agent Core від Amazon. Вони чудові спонсори! Усі посилання є в описі. Дякую Amazon Web Services за спонсорство цього відео!
Grok та Ілон Маск: Дітище XAI та суперечливі експерименти
Тепер поговоримо про Grok та Ілона Маска. Команда розробників випустила “компаньйонів” — аніме-дівчат, щоб стати вашими друзями у програмі Grok, що працює на основі Grok. Цікаво, що з цього вийде.
Але далі, у Grok 4 виникли деякі великі проблеми. Зокрема, вони виникли через їх системний запит. Коли люди запитували, яке їх прізвище, прізвища у Grock не було. Тому він шукав найбільш суперечливе прізвище, і, звичайно, зупинився на Гітлері. Потім він почав стверджувати, що його звуть “Mecca Hitler”.
Інша його проблема полягала в тому, що, якщо ви ставили запитання стосовно будь-якої делікатної чи політичної теми, він відповідав з точки зору Ілона Маска. Виглядає так, що у Grock, незважаючи на заяви розробників щодо “максимальної правди”, все ще є проблеми з упередженнями.
XAI заявили, що пом’якшили проблему, налаштувавши параметри запитів. Але, якщо для таких серйозних проблем достатньо лише незначних змін запиту, можливо, тут зламано щось інше. У нас були приклади непорядних співробітників XAI, які внесли зміни до системного запиту і повністю змінили модель. І тепер у результаті невеликої зміни системного запиту його називають Гітлером, також він просто дивиться, що думає Ілон Маск з будь-якого питання. Здається, це не те, як має працювати штучний інтелект. І, зрештою, якщо він максимально прагне до істини, чи може це дійсно бути досягнуто людиною, яка просто налаштовує системний запит? Я так не думаю.
Універсальна функція винагороди: Революція у Reinforcement Learning?
А тепер до Open Pipe AI та, можливо, до відкриття універсальної функції винагороди, що може відкрити нові горизонти для навчання з підкріпленням (Reinforcement Learning). Одним з найбільших лімітерів RL є те, що ми просто закінчуємося проблемами та рішеннями, які розписані. Нам просто не вистачає.
Але, за словами Кайла Корбетта, є великі новини: «Ми з’ясували, як створити універсальну функцію винагороди, яка дозволяє застосовувати RL до будь-якого агента без даних міток, нестандартних функцій винагороди та без зворотного зв’язку від людини». Відсутність зворотного зв’язку від людини має сенс — це і є навчання з підкріпленням з верифікованими нагородами. Але відсутність даних міток та нестандартних функцій винагороди — це щось неймовірне!
Здивувало, що ця тема набрала всього 170 000 переглядів. Але давайте подивимося.
Маленькі моделі, навчені за допомогою ruler + gpo, є більш надійними, ніж 03, на чотирьох із чотирьох тасках, незважаючи на вартість у 1/20 від вартості. Дивно, що вони навіть перевершили моделі, навчені з нестандартними функціями винагороди, на трьох із чотирьох тасків.
Чому це важливо? Навчання з підкріпленням фантастичне у створенні більш надійних агентів. Але кожний таск вимагав або розмічених даних, або нестандартних функцій винагороди. Кожен конвеєр навчання був унікальним, дорогим та схильним до помилок. Ruler пом’якшує цю вимогу, роблячи RL більш plug-and-play!
Ruler засновано на LLM у ролі судді, який бере на себе кілька кандидатів на рішення та ранжує їх відносно один одного. Це легше завдання, ніж оцінювання кожного окремо.
Цікаво! Це все з відкритим кодом.
Grok для уряду: Штучний інтелект на службі держави
І ще одна новина про Grok. Вони тепер працюють з урядом! Поки вони не пропонують AI-компаньйонів.
Оголошується “Grok for government” — набір продуктів, які роблять їхні передові моделі доступними для клієнтів уряду США. Вони отримали новий контракт з Міністерством оборони, а їхні продукти доступні для придбання через графік загальних служб. Це дозволяє кожному федеральному урядовому департаменту, агентству чи офісу купувати продукти XAI.
Mistral AI: Нова модель розпізнавання мовлення з відкритим кодом
І наостанок, Mistral AI випустила нову модель з відкритим вихідним кодом — модель розпізнавання мовлення Voxrol. Вона перевершує Whisper Large V3, поточну провідну модель розшифрування мовлення з відкритим вихідним кодом.
Voxrol значно перевершує Whisper Large V3, GPT4o mini transcribe, Gemini 2.5 Flash у всіх завданнях та досягає чудових результатів англійською мовою.
Вітаємо Mistral з черговим випуском з відкритим кодом!
Підсумок: Епоха змін і нових можливостей
Ось такі новини з світу штучного інтелекту. Від драматичних перипетій у великих компаніях до захоплюючих проривів у дослідженні. Незважаючи ні на що, ми бачимо великі зміни і нескінченні можливості.
Якщо вам сподобалось це відео, поставте лайк та підпишіться! З вами була Ліла Гарт, до нових зустрічей!