Експерти про майбутнє AI: Від математичних олімпіад до політики Білого дому
Звуки інтелекту, що народжується з рядків коду та складних алгоритмів, наповнюють повітря відчуттям великих змін. Цього тижня в “Mixture of Experts”, під керівництвом Тіма Хуанга, зібрався блискучий. Ансамбль мислителів, щоб розібрати та донести найактуальніші новини у сфері штучного інтелекту. У цьому випуску ми занурюємося у феномен Міжнародної математичної олімпіади (IMO), розглядаємо нові горизонти OpenAI та аналізуємо стратегію управління AI, що розробляється Білим домом.
Разом з Тімом у випуску були:
- . Зрозуміло,
- Кейт Соул, директорка з управління технічними продуктами в Granite.
- Гейб Гудхарт, головний архітектор AI для відкритих інновацій.
- Міхі Креветті, видатний інженер Aentic AI.
- Раян Хагаман, глобальний керівник з питань політики AI.
бачите,
Атмосфера, як завжди, була інтенсивною, а дискусії – захоплюючими. До речі, початок розмови змусив задуматися про начебто, масштаб проблеми, яку вже вирішили нові системи штучного інтелекту.
Математика та AI: Чи є це епохальним проривом?
Варто зазначити, що DeepMind та OpenAI заявили про те, що їхні системи досягли. “золотого стандарту” на Міжнародній математичній олімпіаді, перемігши, по суті, 8-10% найкращих математиків серед школярів. Цікаво, звісно, ця новина викликала резонанс – але чи варто розглядати це, як появу нового “AlphaGo”?
Гейб, колишній математик, який згодом став комп’ютерним науковцем, відзначив, що особисто для нього, як для людини. Яка усвідомила, що комп’ютери вміють робити математику краще за неї, ця новина одночасно й втішна, й не дивна. Дивно, він підкреслив глибину логіки та використані техніки, назвавши це “крутим зміщенням в технологіях”. Але він не вірить, що ця новина миттєво змінить світ.
Зі свого боку, Кейт вважає, що це можна. Прирівняти до ефекту AlphaGo – тобто, ми зламали новий бенчмарк. Але, як і з дивіться, AlphaGo, немає відчутного реального впливу найближчими роками. Кейт не вірить, що це означає миттєве відкриття. Загального штучного інтелекту (AGI) і зникнення всіх поточних проблем. Навпаки, це – вражаюча перемога в складному змаганні.
Третім спікером у питанні був Міхі. Він вважає, що це справді круто, адже демонструє багато технік, які використовуються в Aentic AI. Наприклад, використання обчислень, побудова калькуляторів та застосування цих функцій для вирішення проблем – це не просто опора на те, з чим навчені великі мовні моделі. З цієї точки зору, це демонструє зростання, коли методи Aentic стають. Більш точними та специфічними для типу задач та навантаження, яке їх застосовує. Дивно,
Тім згодом повернувся до Гейба, щоб краще зрозуміти масштаб Міжнародної математичної олімпіади (IMO). Гейб відповів, начебто, що як студент гуманітарних наук з добрими математичними здібностями. Він обрав математику, але згодом перейшов до комп’ютерних наук, визнавши їх кращими. Гейб відзначив, розумієте, що математика – це чітко визначена екосистема з суворими правилами. І чим глибше занурюєшся в математику, тим більше досліджуєш межі й особливості цих правил. Справа в тому, що він підкреслив, що це захоплююче, оскільки нові методики дозволяють моделям глибше розуміти математичні межі.
Міхі додав, що технології розвиваються. Ми більше не просто кидаємо простий запит, ми витрачаємо. Час на створення інструментів приблизно, та визначення способу їх використання. Раніше, щоб знати відповідь на питання, потрібно відправити токен, що коштує копійки. Результат, швидше за все, був би не от, дуже хорошим, але ти все одно з ним працював би знов і знов, намагаючись покращити його. Тепер – все набагато паралельніше. Фактично, ви запускаєте мільйони токенів на сотні різних інструментів, перевіряючи їх на кожному кроці. Міхі вважає, що такий баланс є ключовим, але підкреслює, що не кожен запит вимагає такого підходу, особливо враховуючи його вартість.
Кейт зазначила, що подібність до AlphaGo полягає в тому, що ми досягли нового рівня. Але це не означає миттєву зміну в підходах до вирішення математичних задач. Це буде поступове покращення, а не стрибок. Кейт згадала, що це вже не перший випадок, коли Gemini або Google показують результати у математичній олімпіаді. Цікаво, вона також підкреслила, що важливим є те, що тепер вони можуть вирішувати в. Межах часу, виділеного на олімпіаді, тоді як раніше на це потрібні були дні. Кейт вважає, що ми наблизилися до більш практичних технік, що дозволяють працювати в реальному часі.
етап дискусії, Тім підняв питання важливості оцінювання (eval). Він зазначив, що для отримання експертної оцінки потрібно витрачати все. Відверто кажучи, більше часу та залучати більше людей, що може створити ускладнення. Простіше кажучи,
Гейб розповів, що чим вужче коло експертів, що можуть вирішити проблему, тим складніше провести суворе оцінювання. Він припустив, що з часом доведеться покладатися на довіру до моделі, яка показала хороші результати в інших областях. І, можливо, ми почнемо застосовувати техніки, коли кілька моделей перевіряють одна одну, коли жодна не є джерелом істини, але забезпечується перехресна перевірка.
GPT-агенти: Нова ера співпраці з AI? Цікаво,
Тім перейшов до обговорення великої новинки – випуску GPT-агента від OpenAI. Це функція, яка дозволяє взаємодіяти з моделлю, використовуючи агентну поведінку, наприклад, браузер. Цікаво, за словами Тіма, ця функція доступна лише на рівні преміум-підписки.
Міхі, який щодня працює з агентами, назвав це, десь так. Не зовсім новинкою, адже десь так, GPT вже має внутрішні агенти. Наприклад, код у sandbox для створення діаграм. Він стверджує, що ця функція просто розширює кількість доступних інструментів та робить їх більш налаштовуваними. Цікаво, це також додає більшу підтримку таких функцій, як перегляд вебсторінок. Дивно, міхі вважає, що ринок рухається до агентів. Безумовно,
Кейт погоджується з цим, але, на її думку, з технічної точки зору це просто невелике покращення. Вона вважає, що це великий крок вперед у. Фактично, взаємодії користувачів із AI, особливо враховуючи можливості асинхронних процесів. Кейт звернула увагу на маркетингові матеріали OpenAI, які роблять акцент на можливості відійти від роботи, а потім повернутися до неї. Вона ставить питання, наскільки можна довіряти агенту, якщо йому потрібно давати дозвіл на кожному етапі, десь так.
Тім додав, що це нагадує ранні дні комп’ютерів, коли їх використовували для зберігання рецептів. Кейт описала цю ситуацію, коли агенти – це класно, але як ними користуватися, не зрозуміло.
Кейт сумнівається, що це змінить підхід до розв’язання всіх проблем. Вона ну, не бачить готовності громадськості довіряти моделям. Вона вважає, що ми ще далекі від впровадження в корпоративному середовищі, враховуючи питання безпеки. Кейт підкреслила, наскільки важливим є правильний споживчий досвід, адже. Це може створити проблеми для впровадження в корпоративному секторі.
Міхі додав, що в таких ситуаціях працює алгоритм “спочатку – споживачі, потім – корпорації”.
Гейб зазначив, що він довіряє агентам, поки вони не беруть на себе великі ризики. Він наприклад, готовий експериментувати та використовувати їх для прискорення роботи. Чесно кажучи, він підкреслив різницю між GPT-3 та. ChatGPT, у якій все вирішила інструкція налаштування ChatGPT.
Тім бачите, задав питання про ключові сфери, у яких Гейб готовий використовувати агентів. Гейб відповів, що це будуть сфери, де він є кінцевим арбітром результатів. Він вважає себе тобто, повільним у прийнятті технологій, у яких є магія, приблизно так. Гейб та Кейт погодились, що це одночасно й незначні зміни в технологіях, і великий крок у UX. Насправді,
Третій сегмент взагалі, дивіться, шоу був присвячений проекту MCP Gateway від Міхі Креветті.
MCP Gateway: Розплутуючи хаос в світі протоколів агентів AI
Міхі поділився своєю мотивацією щодо створення проекту MCP Gateway. Його концепція базується на розумінні агентів AI як потенційних внутрішніх загроз. Безумовно, будь-яка взаємодія агента з системою через інструмент – це потенційний ризик, адже агент. Насправді, отримує вхідні дані, що можуть призвести до видалення інформації з бази даних або коду. Тому було потрібно забезпечити: 1) спостереження; 2) захист. Фактично, слухайте, 3) моніторинг; 4) безпеку; 5) авторизацію; 6) аутентифікацію.
Міхі згадав, що спочатку команда не перевела свій проект у відкритий код, проте усвідомила, що потрібен стандарт взаємодії агентів з інструментами. Згодом, ідея була втілена в Model Context Protocol (MCP) від Entropy. Однак ситуація ускладнилася з появою різних версій протоколу та різних реалізацій, які не завжди відповідали вимогам.
Саме тому було створено скажімо, MCP Gateway, відкритий проект, що дозволяє:
- Об’єднувати кілька серверів з різними ресурсами та інструментами в один віртуальний сервер.
- Використовувати уявіть собі, аутентифікацію, авторизацію, механізми повторних спроб та моніторингу.
- Встановлювати обмеження.
- Підключати плагіни для попередніх та наступних дій для кожної операції.
- Перетворювати REST API на MCP сервер.
Простими словами: MCP – це стандарт, але його реалізація в реальному світі буде складною. Мета MCP Gateway приблизно, – створити механізм контролю над цим хаосом.
Гейб бачить в цьому чудовий момент для реалізації такого проекту. Справа в тому, що адже зараз відбувається розквіт нових відкритих стандартів для взаємодії з AI. Він проводить аналогію з HTML та HTTP, де було багато помилок. Гейб підкреслив необхідність гнучкості клієнтської сторони та надійності серверів. Він вважає, що найближчим часом з’являться різні реалізації MCP. Міхі, зі свого боку, додав, скажімо, що їхній проект допоможе ізолювати та систематизувати всі ці процеси.
Сам Міхі зазначив, що проект спрощує роботу значить, з агентськими структурами, відокремлюючи логіку від агента.
Стратегія AI Білого дому: Нове дихання для інновацій
Раян Хагаман приєднався до розмови, щоб обговорити щойно опублікований план дій Білого дому щодо AI. За словами Раяна, це стратегія національного масштабу.
Раян зазначив, що це дуже важливий документ, до якого вже готувалися майже півроку. План – це політичний порядок уявіть собі, денний адміністрації щодо AI, який може стати поштовхом для законодавчих змін.
План слухайте, містить близько 134-135 індивідуальних рекомендацій, що адресовані різним агентствам. План підкріплено трьома виконавчими указами президента. План містить три основних напрямки:
- Прискорення інновацій в AI.
- Будівництво американської інфраструктури AI.
- Лідерство в міжнародній дипломатії та безпеці AI.
Раян відзначив позитивну тенденцію, наприклад, визнання важливості розробки open-source та open-weight. На його думку, політики повинні сприяти розвитку відкритого простору.
Раян відмітив, що позитивним моментом є перехід від нейтралітету до позитивного ставлення до open-source моделей, що дасть поштовх до адміністративних змін.
Виконавчі укази стосуються енергетики, дата-центрів та побудови інфраструктур, десь так. Укази, по суті, спрощують регуляторні процеси для будівництва нових центрів обробки даних та забезпечення енергопостачання.
в принципі,
Виклик полягає в експорті американських технологій. Раян зазначив, що департамент торгівлі має визначити партнерів, які. Разом з індустрією будуть створювати пакети експорту для всього AI-стеку.
Раян зазначив, що за цим стоїть велика. Робота та багато відповідей на запити, що попереду.
випуску обговорювалося питання важливості спрощення взаємодії з агентами та забезпечення довіри до них. Кейт зазначила, що це велика проблема, яка вимагає більш надійних рішень. Міхі зазначив, що відділення логіки та дозволить спростити їхнє використання.
В підсумку, “Mixture of Experts” представляє собою безцінну платформу, яка показує трансформаційний шлях, яким рухаєтьс З кожним випуском, експерти розширюють горизонти знань, проникаючи в складнощі інновацій та їхнього впливу на світ навколо нас.