Рік у Світлі Дзеркал: Розмови про Майбутнє Штучного Інтелекту та Спогади про Епоху Агентів
Минулий рік був бурхливим для світу штучного інтелекту. Від захвату відкритими моделями до обережних кроків у сфері безпеки – усе вирувало, змінювалось та переосмислювалось. Зустрічайте – святковий епізод “Суміші Експертів”, присвячений річниці підкасту, що зібрав команду першого випуску для глибшого занурення в реалії та тенденції, що визначають майбутнє.
У цій захоплюючій розмові зібралися знайомі обличчя: Тім Хван (ведучий), Куш Варшні (IBM Fellow у сфері управління штучним інтелектом), Шобхіт Варшні (керівник відділу даних та штучного інтелекту для Америки) та Кріс Хей (інженер та технічний директор з трансформації клієнтів). Вони вирушили у подорож спогадами, аналізуючи найважливіші події минулого року та розмірковуючи над новими викликами та можливостями, що виникають на горизонті.
LlamaCon: Відкриті Моделі та Розвиток Екосистеми
Епізод розпочався з обговорення LlamaCon, першої конференції, організованої Meta та присвяченої їхній роботі у сфері відкритих вихідних кодів і моделям сімейства Llama. З анонсуванням нових розробок постало багато важливих питань.
Шобхіт Варшні висловив захоплення запуском Llama API. Це важливий крок для Meta, адже вони створюють платформу, яка поєднує найкращі риси закритих і відкритих моделей. Тепер розробники можуть мати централізоване місце для експериментів з моделями Llama, включаючи інструменти тонкої настройки та оцінки. “Вони хочуть бути максимально орієнтованими на розробника. Вони нададуть вам центральне місце з усіма ігровими майданчиками, можливостями тонкої настройки, а також оцінками і так далі”, – зазначив Шобхіт, підкреслюючи стратегічний перехід Meta від простого надання моделей до створення цілої екосистеми.
Кріс Хей додав, що цей крок може бути як проявом сили, так і слабкості. Він визнав, що Meta інвестує більше в цю сферу, розуміючи великі можливості. Незважаючи на це, Кріс висловив застереження щодо сумісності API з OpenAI, що може обмежити можливості. “У тонкій настройці конкретно складно… Витягнути свої моделі з існуючих стеків і перенести їх кудись ще – це складніше. Тож я думаю, що це диференційована гра, на мій погляд”, – підкреслив він.
Обговорення перейшло до питань безпеки та захисту – Llama Guard, Llama Firewall, Llama Prompt Guard 2. Кріс висловив занепокоєння зростаючою складністю екосистеми безпеки. Він зазначив, що нинішні інструменти безпеки – наприклад, Llama Guard 4 з його мультимодальними можливостями – потребують ретельної оцінки. Він підкреслив роль і значення Guard Bench та потенціал Granite Guardian. Кріс підсумував, що з часом люди усвідомлюють серйозність безпеки та захисту, і наявність кількох рівнів захисту – це правильний підхід.
Шобхіт доповнив обговорення, згадавши Meta AI App – уніфікований додаток для всіх інтелектуальних можливостей Meta. Такий додаток може стати серйозним конкурентом для ChatGPT та Gemini, особливо враховуючи доступ до даних користувачів у WhatsApp, Instagram та Facebook. Поєднання таких особистих даних з ШІ може надати неймовірні можливості, але вимагає делікатного балансу між конфіденційністю і персоналізацією. Шобхіт також наголосив на важливості відкритого вихідного коду та впливу Llama на розвиток відкритих моделей. Він також згадав про майбутні моделі – меншу модель Llama на 8 мільярдів параметрів, важливу для корпоративних користувачів, та велику модель, потенціал якої ще належить розкрити. Поряд з цим Шобхіт висловив очікування щодо розвитку оркестровки мультиагентів і підтримки MCP.
У підсумку, подія LlamaCon виявила важливі кроки у розвитку відкритих моделей, розширенні екосистеми та покращенні безпеки.
Китайський ШІ: Гібридні Моделі та Нові Горизонти
Далі розмова перейшла до Китаю, де Alibaba випустила Qwen3 – нове покоління моделей. Обговорення зосередилося на так званих “гібридних моделях”, що поєднують “режим мислення” та “не-мислення”.
Кріс Хей пояснив, що “мислення” – це процес логічних роздумів, а “не-мислення” – швидкі відповіді на прості питання. Моделі спочатку дають відповідь та продумують її, як люди. “Ви можете уявити собі деякі з цих проблем, які набагато важче вирішити… Тож, якщо прирівняти час на роздуми до кількості токенів… то, чим більше токенів, які ви генеруєте, тим більша ймовірність, що ви отримаєте адекватну відповідь”, – пояснив він.
Шобхіт доповнив обговорення, зосередившись на важливості “гібридного режиму” для різних типів запитань. Для легких питань потрібно одразу видавати відповідь, а для логічних – спочатку обдумувати. Кріс зазначив, шо важливо мати “бюджет на мислення”, тобто ліміт часу на обдумування.
Кріс також підняв питання про повернення концепції експертних систем, про що свідчить Qwen3. Це технологія, яка була популярна в минулому, з новими можливостями. “Це питання про те, що людям не потрібно використовувати весь свій мозок одночасно, так само, як і у ШІ”, – зазначив Кріс. Це дозволяє використовувати менше обчислювальної потужності та ресурсів, активовуючи лише відповідні частини моделі. Кріс також зазначив, що спеціалізація різних експертів може стати ключем до успіху.
Далі обговорювалось потенційне домінування Китаю на ринку ШІ, зокрема, натякнули на DeepSeek-R2, та його тренування на чіпах Huawei Ascend 910B. Це свідчить про спроби обійти залежність від американських постачальників. Шобхіт зазначив, що Китай може отримати перевагу, володіючи не лише чіпами, але й екосистемою навколо них. Він підкреслив переваги моделей, що дозволяють знизити вартість інтелекту, а також необхідність забезпечення безпеки, що має особливу важливість.
Підводячи підсумок обговорення, Шобхіт підкреслив позитивний вплив конкуренції на відкритий код, інновації та покращення якості. Крім того, він звернув увагу, що деякі китайські компанії стали відкритішими до коду, а DeepSeek – яскравий приклад.
Увага була приділена маленькій корейській компанії Dia, що розробила модель перетворення мовлення в текст, яка перевершує результати більших компаній та пропонує Apache 2.0 відкритий код. Шобхіт підсумував, що ШІ розвивається у всьому світі, а не лише в США та Китаї.
Безпека SaaS та Майбутнє Управління: Погляд J.P. Morgan Chase
Наступним пунктом порядку денного стало відкрите звернення Патріка Опета, директора з інформаційної безпеки J.P. Morgan, до індустрії. Головний меседж – необхідність посилення безпеки SaaS, особливо враховуючи вплив ШІ.
Кріс зазначив, що сама концепція агентів не є новою, особливий інтерес викликає взаємодія з ними за допомогою природної мови. Він наголосив на необхідності ще більшої уваги до безпеки та управління, адже традиційним підходам може завадити натиск агентів.
Шобхіт підкреслив, що впровадження агентів у SaaS-платформи вимагає нового підходу до безпеки, адже нинішні стандарти можуть виявитися неефективними. Він підкреслив важливість прозорості та контролю, а також необхідність єдиних правил для багатьох постачальників SaaS. Він акцентував на важливості напрацювань Куша та його команди у сфері безпеки та управління, які мають ключове значення. Шобхіт дійшов висновку, що 2025 рік може стати роком управління.
Кріс запропонував власне рішення, наголошуючи на тому, що замість того, щоб намагатися вирішити все із застосуванням додаткового управління, можна зосередитися на створенні кращих агентів. Обговорення перейшло до поєднання зусиль, що передбачає правильне проектування безпеки та уникнення надмірних обмежень.
Кріс Хей зосередився на важливих аспектах контролю та управління, наголошуючи на необхідності бути адаптивними до різних сценаріїв, враховуючи такий важливий фактор, як креативність у відповідях. Він висловив думку, що у деяких випадках галюцинації можуть бути корисними, але, насамперед слід збалансувати всі ці перестороги.
У підсумку, було підкреслено важливість забезпечення безпеки, а також необхідність розвитку управління та контролю в умовах стрімкого розширення сфер застосування ШІ.
Спогади про Перший Випуск: Агенти, Rabbit та GPT-2
На завершення епізоду команда повернулася до спогадів про свій перший епізод.
Першим питанням було обговорення Rabbit R1. Шобхіт поділився, що нині пристрій зберігається у гаражі. І Кріс блискуче вгадав, що цей пристрій – не що інше, як “пейджер”, підтвердивши свою слушну думку.
Потім команда звернулась до обговорення загадкового чат-бота GPT-2 на платформі Chatbot Arena. Тоді обговорювалась ймовірність появи GPT-5. Кріс дійшов до висновку, що це буде GPT-4.5, і це виявилося майже точним!
Наостанок згадали тему агентів, яка стала своєрідним “жартом” у майбутніх епізодах. Шобхіт Варшні був визнаний “автором” цієї фрази. Куш Варшні зазначив, що в той час Ендрю розповів про те, як GPT 3.5 може перевершити GPT-4 з інструментами. Тим підкреслив, що спільнота досягла значного прогресу в сфері агентів.
Епізод завершився святкуванням річниці та подякою всім причетним до успіху “Суміші Експертів”. Гості висловили надію на зустріч у 2025 році, щоб підбити підсумки подальших подій у світі ШІ.