Майбутнє тут, і воно дихає: Розмова з AI та роботами
Якось, сидячи за чашкою міцної кави, я почула дивовижну історію. Вона почалася з робота, але розкрила набагато більше – хвилюючий світ перетворень, що починає накривати нас. Ця історія змусила задуматися про те, куди ми рухаємося, і з яким темпом росте ця могутня нова сила під назвою Штучний Інтелект.
Почнімо з компанії, яка тісно співпрацює з Nvidia, щоб продемонструвати та розгорнути робочу систему Dexter AHRGB. Вони використали верхню частину тулуба свого робота Atlas MTS, оснащену трипальцевими захватами, щоб продемонструвати можливості Dexter AHRGB. Уявіть собі: цього робота повністю навчили в симуляції, використовуючи лабораторію Isaac від Nvidia. А потім, без жодної додаткової тонкої настройки, він блискуче переніс свої навички у реальний світ. Це називається “нульовим пострілом” чи “sim-to-real”, коли навчання в симуляції одразу дає чудові результати у реальності.
Робот, як ви можете бачити, здатен хапати промислові, легкі та важкі предмети, демонструючи навіть спроби повторного захоплення, якщо у нього щось випало. Завдяки цьому платформа, розроблена Boston Dynamics, підтверджує, що робоче навантаження штучного інтелекту Nvidia може вийти за межі симуляції та виконувати реальні завдання.
Це, на мою думку, не просто етап, а справжній прорив. Людські роботи постійно розвиваються, стають все кращими. Коли з’являться загальні роботи, які зможуть робити те, чого раніше не вміли, навчені за мільйони годин у симуляціях, і одразу покращувати свої навички, я думаю, люди почнуть розуміти, наскільки божевільними стануть ці роботи. Зараз відчуття, як з появою iPhone, чи на зорі інтернету. Все є, але вплив ще не такий відчутний.
Але ще більш захоплюючою мені здалася інша історія. І щиро дивуюся, чому її не підхопили ширше. Одна компанія досягла неймовірного: розробила робота з нульовим пострілом, який може прибирати в будинку, якого він раніше ніколи не бачив. Йдеться про компанію Pi Zero, яка створила фундаментну модель для робототехніки. Абсолютно шалено! Робота навчили лише в симуляції, і він їде в будь-який будинок і прибирає його.
Людина може адаптуватися до нових умов. Роботи можуть працювати лише в тих умовах, де вони були навчені. І ось, Pi Zero – перший крок до зміни цієї ситуації. Вони протестували його в Airbnb в Сан-Франциско, яких роботи ніколи не бачили, і він ефективно прибирав в цих місцях. Це як момент ChatGPT для робототехніки. Робот йде в будинок і робить те, що раніше в подібному середовищі не робив.
Чому це важливо? Тому що роботи зазвичай погано узагальнюють знання до нових умов. Багато фахівців стверджували, що якщо робот зможе просто зайти в будинок і приготувати каву з нуля – це буде справжнім проривом. Я не впевнена, чи зможе цей робот поки що це зробити, але прибирання в незнайомому будинку – видатне досягнення.
І знаєте, ця компанія існує лише близько 18 місяців. Вони отримають мільярди доларів фінансування. Такі компанії як Amazon та OpenAI інвестували в них мільйони. І саме ця компанія зосереджується не стільки на обладнанні, скільки на створенні “мозку” для цих штучних інтелектуальних роботів. Саме до них звертатимуться компанії, як Tesla та Figure, коли їм треба буде розгорнути своїх роботів в нових умовах.
Але, звичайно, є і інша сторона медалі. Коли ми говоримо про штучний інтелект, неможливо обійти питання “AI, що вбиває”. Ден Хендрікс провів дослідження щодо OpenAI 03, в якому показав, що моделі OpenAI досягають успіху у роботі з вірусами. Настільки успішно, що їхня робота перевершує 94% реальних експертів-вірусологів у спеціальному тесті.
Тест оцінює, чи може ШІ розуміти складні експерименти, як-от лабораторні тести на грип, усувати проблеми, такі як невдалі експерименти, і розв’язувати складні наукові питання, як справжні вірусологи. Графік показує, що ШІ з часом стає кращим, і OpenAI 03 зараз значно випереджає попередні ШІ в розумінні та вирішенні проблем, пов’язаних із вірусами.
Небезпека в тому, що штучний інтелект може допомогти створити небезпечну біологічну зброю. Моделі постійно стають розумнішими, а це означає, що вони зможуть виконувати все більше завдань. Це як дати рушницю дитині.
До речі, OpenAI, можливо, доведеться обмежити доступ до деяких моделей, якщо їх можливості стануть занадто великими для пересічного користувача.
Інша цікава тема – це поява віртуальних співробітників. За прогнозами Anthropic, віртуальні співробітники на основі штучного інтелекту почнуть працювати в корпоративних мережах протягом наступного року. Це означає, що компаніям потрібно буде переглянути свої стратегії кібербезпеки або ризикувати порушеннями безпеки. Віртуальні співробітники матимуть власну пам’ять, ролі в компанії та навіть облікові записи й паролі. Вони матимуть рівень автономії, який значно перевищує те, що мають сучасні агенти.
Проблема в тому, як захистити ці облікові записи, до яких мереж їм слід мати доступ, хто буде відповідальним за їхні дії, якщо щось піде не так. Anthropic має допомогти компаніям впоратись з цими проблемами. Вони перевірятимуть моделі Claude, щоб переконатися, що вони витримують кібератаки, і контролюватимуть проблеми безпеки. Рівень автономії, який матимуть ці моделі, буде таким, якого ми ніколи не бачили.
До речі, деякі експерти вважають, що зараз ми зіштовхнулися з деякими проблемами, наприклад, з “галюцинаціями” ШІ-агентів. В першу чергу потрібно вирішити саме цю проблему.
Окрім цього, зацікавила мене інформація про те, що Meta відчуває тиск. Пайман Міланфар, провідний науковець Google, керівник команди обчислювальної візуалізації у Google, зазначив, що отримав багато резюме від фахівців з Meta. Основна причина – Llama 4 від Meta не виправдав очікувань. З’явилися певні підозри щодо довіри до результатів їхніх бенчмарків.
Наразі ситуація для Meta не найкраща. Але у них є мільярди користувачів і багато інших переваг, тому вони обов’язково зможуть знайти своє місце.
До речі, цікавим є бенчмарк Sherlock Bench, який вимірює здатність LLM активно досліджувати проблему. Він стійкий до запам’ятовування, оскільки не використовує формат запитань і відповідей. Він перевіряє, чи може модель застосувати науковий метод – тобто висувати гіпотези, експериментувати та аналізувати. Для відмінної роботи на цьому бенчмарку модель має використовувати виклик функцій та структуровані виходи.
Наразі 04 Mini від OpenAI є лідером у цьому бенчмарку.
Microsoft, судячи з усього, готує нову модель штучного інтелекту або партію великих мовних моделей для кодування. Це може бути відкрита модель, що може кодити. Поки що інформації мало, але ймовірно, вона розробляется в серії Fi і призначена для кодінгу.
Також Ілон Маск повідомив, що Grock 3.5 буде доступний в ранній бета-версії для користувачів Super Grock. Вона має вражаючі можливості для розв’язання технічних питань щодо ракетних двигунів чи електрохімії, і що грок може згенерувати відповіді, яких немає в інтернеті.
Але є й певні попередження. Комп’ютерний вчений Стюарт Рассел передбачив чотири ключові сценарії майбутнього.
Перший – що масштабування LLM лише не призведе до загального штучного інтелекту. Другий – що AI-лабораторії вже зрозуміли це і досліджують нові методи. Третій – що уряди не вживатимуть заходів щодо безпеки ШІ, поки не станеться великий інцидент. Найкращий сценарій – це те, що потрібна катастрофа, подібна до Чорнобиля, щоб уряди почали діяти. Найгірший варіант – втрата контролю над ситуацією.
Ще новина: у Chat GBT додають функцію покупок. Це може означати значне зниження ролі пошуку. Visa запускає агентів ШІ, які будуть робити покупки та платити від вашого імені. У найближчі кілька місяців агенти будуть купувати речі за нас. Це стосується квитків на концерт, подарунків та багато іншого. Вони будуть надавати агентам можливості здійснювати платежі від імені користувачів.
Ось таке воно, майбутнє. Швидке, непередбачуване, але все ж захоплююче.