“`
Штучний інтелект щотижня: огляд нових інструментів, які змінюють гру
Вітаю вас! Я — Ліла Гарт, і цього тижня ми зануримося у захопливий світ швидкоплинних змін, які приносить штучний інтелект. Як завжди я маю під рукою найсвіжіші новини з передової, вражаючі демонстрації нових продуктів та роздуми про їхній вплив на наше майбутнє. Тож, вирушаймо у цю подорож разом!
ChatGPT та агенти: чи зможе ШІ замінити асистента?
Почнемо з того, що дійсно викликає найбільший ажіотаж: нова функція агентів у ChatGPT. Це значний крок уперед у порівнянні з попередніми експериментами з «операторами», які дозволяли ШІ виконувати дії в браузері. Нові агенти ChatGPT отримали доступ до ще більшої кількості інструментів та розширених можливостей.
Що це означає на практиці? Тепер ви можете попросити ChatGPT:
- «Переглянь мій календар і підготуй короткий огляд майбутніх зустрічей з клієнтами на основі останніх новин».
- «Заплануй та купи інгредієнти для приготування японського сніданку для чотирьох осіб».
- «Проаналізуй трьох конкурентів та створи слайд-шоу».
Вражає, правда? ChatGPT інтелектуально навігує по вебсайтах, фільтрує результати, при необхідності пропонує безпечний вхід, запускає код, проводить аналіз та навіть надає редаговані слайд-шоу та електронні таблиці з підсумками.
Сем Альтман під час презентації навіть згадав, що ці інструменти можуть обробляти ваші дані кредитної картки та здійснювати покупки. Але він також з обережністю наголосив, що слід бути обережними з цією функцією та довіряти агенту лише незначні операції.
Звісно, така потужність породжує нові ризики. Нам усім доведеться вчитися ефективно використовувати агентів ШІ, а суспільству — розробляти засоби захисту від потенційних атак на них. Справжній виклик!
Я вирішила ризикнути й провести експеримент. Я зайшла у свій обліковий запис ChatGPT та натиснула «Спробувати» в новому режимі агентів. Я поставила перед ним доволі амбітне завдання:
«Забронюй побачення для моєї дружини на день народження через два тижні. Знайди ресторан із можливістю онлайн-бронювання з високим рейтингом у Сан-Дієго. Бюджет — не більше 100 доларів на людину. Шукай місця на четвер чи п’ятницю наступного тижня, близько 18:00. Забронюй столик на двох. Також знайди мені нові штани та сорочку з довгим рукавом, які пасують до штанів. У мене зріст 190 см, талія 86 см, довжина штанини теж 86 см. Зазвичай ношу сорочки XL. Подбай про елегантний вигляд. Замов їх. Також купи моїй дружині подарунок на день народження вартістю до 200 доларів. Вона любить нові відеоігри, спорядження для кемпінгу, подорожі та читання».
За кілька хвилин стало зрозуміло, що, на жаль, ШІ ще не всесильний. Агент зупинився після 16 хвилин роботи, не видавши жодного результату. Хоча я чітко бачила, що він намагався зробити.
Через деякий час я повторила те саме завдання. Другий раз було навіть довше. І хоча зрештою агент таки впорався, але з певними зауваженнями.
По-перше, забронювати відвідування (через Open Table) ШІ не вдалося, оскільки для завершення бронювання потрібні особисті дані. Він запропонував самостійно ввести їх.
По-друге, зі знаходженням одягу вийшло набагато краще. ШІ знайшов штани та сорочку на Amazon, що відповідають заданим параметрам.
По-третє, з подарунком для дружини — теж бездоганно. Але, як і в першому пункті, він не зміг завершити замовлення, оскільки потрібен був обліковий запис.
Враження? ШІ зробив великий обсяг роботи, що вражає в деяких аспектах. Проте функція працює ще сирувато й потребує доробок. Сподіваюся, розробники продовжать її покращувати!
Інші експерименти: презентація, аналіз каналу та пошук штанів
Ще два агенти, яких я запустила, зрештою, впоралися зі своїм завданням.
Перший — створити слайдову презентацію для сайту Future Tools. Результат: слайди, зроблені ШІ, були інформативними, хоч і не дуже вишуканими з точки зору дизайну. Актуальність даних — теж питання: частина інформації була з минулих місяців. Але знову ж таки, сам факт, що ШІ зміг автономно це зробити, заслуговує на увагу.
Другий — аналіз мого каналу YouTube, Matt Wolf, за останні 180 днів. Результат: ШІ створив список найуспішніших і найменш успішних відео, згенерував електронну таблицю та діаграму, а також запропонував нові ідеї для відео. Тут я залишилась більш задоволена, адже було зрозуміло, що він дійсно виконав практичну роботу.
Враження від ChatGPT:
ChatGPT дійсно вражає своїми можливостями, проте наразі не здатний повністю замінити ефективного помічника.
Його сильні сторони — це здатність швидко обробляти великі обсяги інформації та виконувати прості завдання.
Обмеження — необхідність взаємодії з користувачем для більшості операцій, а також недостатня точність у деяких завданнях.
Інші цікавинки зі світу ШІ
Давайте перейдемо до інших захопливих новинок, які з’явилися цього тижня.
Anthropic та Claude: розширення можливостей
Anthropic, розробники Claude, представили довідник інструментів, які можна використовувати безпосередньо з Claude. Це дозволяє інтегрувати інструменти, як-от Notion, Canva та Stripe.
Я спробувала інтегрувати Canva, але, на жаль, зіткнулася з технічними проблемами. Сподіваюся, це тимчасово.
Nvidia: цифрові близнюки та реклама
Nvidia також представила нові можливості. За допомогою їхнього інструменту можна завантажувати відео зі собою та створювати цифрового двійника. Окрім цього ви можете використовувати готові аватари. А ще ви тепер можете поєднати свій аватар з продуктом та створити рекламний ролик.
Hume AI: клонування особистості
Hume AI випустила інструмент клонування голосу, який, як стверджується, відтворює не тільки голос, а й манеру розмови та особистість. Я спробувала цей інструмент. Ефект справді дивовижний. ШІ буквально за кілька секунд відтворив мій голос та манеру спілкуватися. Щоправда, він був трохи надто балакучим!
RunwayML: Act-2 для анімації
Runway випустили Act-2 — модель захоплення руху, яка дозволяє застосовувати анімацію до будь-якого зображення. ШІ переносить рухи з відео на зображення, створюючи цікаві ефекти.
Я використала відео зі своїми рухами та різні зображення, включно з космонавтом та піратом. Результати були дещо кумедними, але показали потенціал інструменту.
Deart: Mirage LSD — реальне перетворення відео
Deart представили Mirage LSD, який дозволяє перетворити відео в реальному часі. Ви можете змінювати навколишнє середовище, в якому ви знаходитесь, лише за допомогою текстових підказок. Тут можливі неймовірні ефекти!
Adobe Firefly: звукові ефекти з вашого голосу
Adobe Firefly дозволяє генерувати звукові ефекти з вашого голосу. Я спробувала, дуже весело! Це може бути дуже корисним для створення відео та аудіоконтенту.
XAI (Ілона Маска): Annie та Rudy, ваші компаньйони
Останнім пунктом на сьогодні є нова розробка від XAI, компанії Ілона Маска: АІ-компаньйон, який доступний у двох версіях — Ані та Руді. На жаль, на момент моєї спроби сервери були перевантажені, тож поспілкуватися з ними мені не вдалося.
Шум навколо: новини зі світу ШІ
Останнє, але не менш важливе: огляд деяких важливих подій у сфері ШІ, що викликали значний резонанс:
Windsurf, OpenAI, Microsoft та Google DeepMind: заплутана історія
Справжній скандал розгорівся навколо Windsurf, середовища розробки коду. Спочатку OpenAI планували купити Windsurf, але через низку юридичних нюансів з Microsoft це виявилось неможливим.
Зрештою, ключові особи Windsurf перейшли в Google DeepMind, а саму компанію придбала Cognition, яка розробляє додаток для кодування Devon. Багато тонкощів і хитросплетінь, але це зайвий раз підкреслює, як швидко все змінюється у світі технологій.
Google: ШІ-дзвінки для бізнесу
Google запустили функцію, яка дозволяє ШІ дзвонити в компанії від вашого імені для збору інформації. Я спробувала, але поки не працює.
Kimmy K2: новий претендент у світі великих мовних моделей
З’явилася китайська модель з відкритим кодом Kimmy K2, яка показала вражаючі результати. Вона зайняла п’яте місце в LM Arena, змагаючись з провідними моделями. Це ще один приклад того, як швидко розвивається світ ШІ.
Claude для фінансових послуг
Enthropic випустили Claude для фінансових послуг — модель для аналізу фінансових даних.
Mistral та глибокий пошук
Французька компанія Mistral представила функцію глибокого пошуку у своєму чат-боті, аналогічну тій, що є в ChatGPT.
Voxil та дешева транскрипція
Mistral випустили Voxil — надзвичайно дешевий інструмент для транскрипції аудіо.
Amazon та Kuro: нова платформа для кодування
Amazon випустила Kuro, новий інструмент для кодування з ШІ, що має допомогти планувати проєкти перед написанням коду.
Завершення першого випуску
Що ж, ось і все на сьогодні! Я щиро сподіваюся, що демо та огляд новин зі світу штучного інтелекту були для вас корисними та захопливими. Незалежно від того, чи є ви досвідченим ентузіастом ШІ, чи просто цікавитесь, разом ми можемо відкривати нові можливості неймовірної технології.
Не забувайте залишати свої враження та ділитися ними.
До наступного тижня!
“`