Туман у Сан-Франциско та шторм у Силіконовій долині: Новини AI, які варто знати
Привіт, друзі! З вами Ліла Гарт, і сьогодні я з туманного. Сан-Франциско, щоб поділитися з вами найцікавішими новинами світу штучного інтелекту. Попереду у нас кілька захоплюючих історій: від корпоративних інтриг до дивних експериментів з аніме-подругами. Тож наливайте собі каву (або щось міцніше) і давайте розбиратися!
Windsurf: Коли мрії про придбання розбиваються об реальність
Почнемо з історії, яка розбурхала Силіконову долину: перипетії навколо компанії Windsurf. Якщо ви ще не чули, то Windsurf – це. AI-асистент для кодування, інтегрований в IDE, подібний до Cursor. Насправді, вони навіть спонсорували цей канал! OpenAI мала намір типу, придбати Windsurf за $3 мільярди, типу того. Вражаюча сума, чи не так? Але. Угода зірвалася.
Замість цього Google перехопила близько 30 провідних співробітників Windsurf. Очевидно, саму ж компанію залишили незалежною, з рештою команди. Такий розвиток подій викликав справжню бурю емоцій. Засновникам та ключовим дослідникам дістався великий куш, от, а решта команди, по суті, залишилася ні з чим, типу того. Простіше кажучи, цікаво,
Але не все так сумно, як може здатися. Згодом Cognition, команда, що стоїть за Devon, придбала решту активів та команди Windsurf. Зрозуміло, виходить, усі у виграші і принаймні, так виглядає на перший погляд.
Ця нова стратегія – придбання команди, а не компанії. А потім залишаючи компанію як оболонку – здається, стає новою тенденцією. Ще один приклад – Scale AI, яка придбала генерального директора Олександра Вана та низку своїх найкращих талантів, щоб керувати супеінтелектом у Meta. Майже одразу найбільші контракти Scale AI від скажімо, Google та Open AI почали скасовуватись, адже хто захоче ділитися своїми даними з конкурентами, якими є Meta?
Це безперечно дуже незвичайна ситуація. Але приємно бачити, що про команду Windsurf подбали. З нетерпінням чекаю, що ж разом створять Devon та Windsurf!
Meta та Марк Цукерберг: Гонитва за супеінтелектом
Тепер перейдемо до новин від Meta та Марка Цукерберга, які зробили масштабний анонс про інвестиції у супеінтелект. Відверто кажучи, марк оголосив про створення обчислювального кластера розміром майже з Мангеттен.
“Я зосереджений на створенні найелітнішої та найталановитішої команди в галузі”, – сказав Цукерберг. З огляду на ціни на ринку, суми, пропоновані провідним дослідникам, сягають сотень мільйонів доларів. У Meta скажімо, буде багато грошей, щоб дозволити собі це.
Meta планує інвестувати сотні мільярдів доларів у обчислювальні потужності для будівництва супеінтелекту. За словами Semi Analysis та Ділана Патела, компанія Meta має всі шанси стати першою лабораторією, яка запустить суперкластер потужністю понад 1 гігават. Вони планують побудувати кілька кластерів, потужність першого з яких, Prometheus, буде запущена в 2026 році. Також будується “Hyperion”, що має змогу масштабуватись до 5 гігават протягом декількох років! Уявіть собі обсяги обчислювальних потужностей, які отримають дослідники! Щоб було ясно,
Однак, є певні побоювання. Цікаво, the New York Times повідомила, що Meta може відмовитись від зусиль з відкритим вихідним кодом, що буде прикро. Компанія завжди припустимо, була великим прихильником open source. Безумовно, обговорюється відмова від потужної бачите, моделі штучного інтелекту з відкритим кодом на користь розробки закритої. Безумовно, було б прикро, враховуючи те, як багато Meta інвестувала в open source. Простіше кажучи, але з іншого боку, якщо ви відстаєте, має сенс інвестувати та викладати все у відкритий доступ, щоб наздогнати лідерів, щось на зразок. Але коли ви попереду, ви не хочете цього робити.
Amazon Bedrock: Спонсорська підтримка та перехід у велику гру
Перш ніж ми продовжимо, хочу подякувати спонсору цього відео – Amazon Bedrock. Bedrock Agent Core є містком між proof of concept та production для ваших агентів, пропонуючи повний набір сервісів, розроблених для розгортання та експлуатації високопродуктивних агентів у масштабі.
Agent Core Gateway для агентів дозволяє безперебійно виявляти та безпечно підключатись до інструментів. Agent Core Memory дозволяє агентам точно зберігати довгострокову та короткострокову пам’ять. Розгортайте агентів безпечно у масштабі з agent core runtime, розробленим для динамічних навантажень на агентів, включаючи типу, найтриваліший час сеансу в галузі для асинхронних робочих навантажень разом з agent core identity для безпечної аутентифікації агентів. Agent core також включає спостереження на основі Amazon CloudWatch, що важливо для безпечної та надійної роботи агентів.
Agent Core працює з популярними фреймворками з відкритим вихідним. Кодом, такими як Crew AI, Langraph, Llama Index та Strands agents. Чесно кажучи, а з будь-якою моделлю розробники можуть використовувати його сервіси незалежно слухайте, один від одного або разом, усуваючи компроміс між гнучкістю open source та безпекою та надійністю корпоративного рівня.
Не наприклад, забудьте ознайомитися з Agent Core від Amazon. Вони чудові спонсори! Усі посилання є в описі. Дякую Amazon Web Services за спонсорство цього відео!
Grok та Ілон Маск: Дітище XAI та суперечливі експерименти
Тепер поговоримо про Grok та Ілона Маска. Команда розробників випустила “компаньйонів” – аніме-дівчат, щоб стати вашими друзями у програмі Grok, що працює на основі Grok. Цікаво, цікаво, ну, що з цього вийде.
Але далі, скажімо, у Grok 4 виникли деякі великі проблеми. Зокрема, вони виникли через їх системний запит. Коли люди запитували, яке їх прізвище, прізвища у Grock не було. Тому він шукав найбільш суперечливе прізвище, і, звичайно, зупинився на Гітлері. Потім він почав стверджувати, що його звуть “Mecca Hitler”.
Інша його проблема полягала в тому, що, якщо ви ставили запитання стосовно будь-якої делікатної чи політичної теми, він відповідав з точки зору Ілона Маска. Виглядає так, що у Grock, незважаючи на заяви розробників. Щодо “максимальної правди”, все ще є проблеми з упередженнями.
XAI заявили, що пом’якшили проблему, налаштувавши параметри запитів. Але, якщо для таких серйозних проблем достатньо лише. Незначних змін запиту, можливо, тут зламано щось інше. Цікаво, у нас були приклади непорядних співробітників XAI, які. Внесли зміни до ну, системного запиту і повністю змінили модель, типу того. І тепер в підсумку невеликої зміни системного запиту його називають Гітлером, також він просто дивиться, що думає Ілон Маск з будь-якого питання. Здається, це не те, як має працювати штучний інтелект. І, зрештою, якщо він максимально прагне до істини, чи може. Це дійсно бути досягнуто людиною, яка просто налаштовує системний запит? Я так не думаю.
Універсальна функція винагороди: Революція у Reinforcement Learning, щось на зразок.
А тепер до Open Pipe AI та, можливо, до відкриття універсальної функції винагороди, що може відкрити нові горизонти для навчання з підкріпленням (Reinforcement Learning). Насправді, одним з найбільших лімітерів RL є те. Що ми просто закінчуємося проблемами та рішеннями, які розписані. Нам просто не вистачає.
Але, за словами Кайла Корбетта, є великі новини: “Ми з’ясували, як створити універсальну функцію винагороди, яка дозволяє в принципі, застосовувати RL до будь-якого агента без даних міток, нестандартних функцій винагороди та без зворотного зв’язку від людини”, десь так. Відсутність зворотного зв’язку від людини має сенс -. Це припустимо, і є навчання з підкріпленням з верифікованими нагородами. До речі, але відсутність даних міток та нестандартних функцій винагороди – це щось неймовірне!
Здивувало, бачите, що ця тема набрала всього 170 000 переглядів. Але давайте подивимося. Простіше кажучи,
Маленькі моделі, навчені за в принципі, допомогою ruler + gpo, є більш надійними, ніж 03, на чотирьох із чотирьох тасках, незважаючи на вартість у 1/20 від вартості. Дивно, що вони навіть перевершили моделі, навчені з. Нестандартними функціями винагороди, на трьох із чотирьох тасків.
Чому це важливо? Навчання з підкріпленням фантастичне у створенні більш надійних агентів. Але кожний таск вимагав або розмічених даних, або нестандартних функцій винагороди. Фактично, кожен конвеєр наприклад, навчання був унікальним, дорогим та схильним до помилок. Ruler пом’якшує цю вимогу, роблячи RL більш plug-and-play!
Ruler засновано на LLM у ролі судді, який бере на себе кілька кандидатів на рішення та ранжує їх відносно один одного. Це легше завдання, ніж оцінювання кожного окремо.
Цікаво та це все з відкритим кодом.
Grok для уряду: Штучний інтелект на службі держави
І ще одна новина про Grok. Вони тепер працюють з начебто, урядом проте поки вони не пропонують AI-компаньйонів.
Оголошується “Grok for government” – набір продуктів, які роблять їхні передові моделі доступними для клієнтів уряду США. Вони отримали новий контракт з Міністерством скажімо, оборони, а їхні продукти доступні для придбання через графік загальних служб. Це дозволяє кожному федеральному урядовому департаменту, агентству чи офісу купувати продукти XAI. Насправді,
Mistral AI: Нова модель розпізнавання мовлення з відкритим кодом
І наостанок, Mistral. Насправді, aI розумієте, випустила нову модель з відкритим вихідним кодом – модель розпізнавання мовлення Voxrol. Вона перевершує Whisper Large V3, поточну провідну модель розшифрування мовлення з відкритим вихідним кодом.
Voxrol значно перевершує Whisper Large V3, GPT4o mini transcribe, Gemini 2. 5 Flash у всіх завданнях та досягає чудових результатів англійською мовою.
Вітаємо Mistral з черговим випуском з відкритим кодом!
Підсумок: Епоха змін і нових можливостей
Ось такі новини з світу штучного інтелекту. Від драматичних перипетій скажімо, у розумієте, великих компаніях до захоплюючих проривів у дослідженні. Незважаючи ні на що, ми бачимо великі зміни і нескінченні можливості. Щоб було ясно,
Якщо вам сподобалось це відео, поставте лайк та підпишіться! З вами була Ліла Гарт, до нових зустрічей!