Штучний інтелект Тижня: Від Apple Vision Pro до Космічних Штурмовиків та Смарт-Холодильників
Привіт, друзі! З вами Ліла Гарт, і я знову занурююсь у захопливий світ штучного інтелекту. Цього тижня океан новин був бурхливим, з новинами, що тягнуть як у технічні глибини, так і в безмежні простори людської уяви. Готові вирушити у подорож? Тоді тримайтеся міцніше!
Apple виходить на сцену з AI
Все почалося з WWDC, щорічної конференції Apple, де яблучна компанія розкрила карти своїх програмних досягнень. Цього року, на відміну від минулого, акцент на AI був дещо меншим, але все ж таки, було що обговорити.
Найбільш корисним нововведенням, на мій погляд, став живий переклад. Уявіть: ви можете спілкуватися з людиною, яка говорить іншою мовою, використовуючи повідомлення, FaceTime або навіть телефонні дзвінки, а система автоматично перекладатиме розмову в режимі реального часу. Магія працює завдяки вбудованим моделям Apple, що обробляють інформацію безпосередньо на вашому пристрої, без необхідності відправляти вашу розмову в хмару. Це означає більшу безпеку та конфіденційність.
На екрані пристрою відображається переклад розмови, дозволяючи двома сторонам вільно спілкуватися, незалежно від мовного бар’єру. Я сама не можу дочекатися спробувати це! А ще, Apple показала новий Genmoji, який дозволяє комбінувати емодзі, як от “лампочка + лінивець” = лінивець з лампочкою! Для тих, кому це потрібно – ласкаво просимо у майбутнє!
Також, нова функція – Visual Intelligence – дозволяє виділити об’єкт на екрані, як-от лампу, і миттєво знайти її аналог в інтернет-магазині Etsy. Це відчувається як зручна інтеграція пошуку зображень, схожа на те, що вже є в Google.
Не обійшлося і без покращень в Apple Watch OS. Нова функціональність допомагає користувачам аналізувати свої показники під час тренувань, а розробники отримали доступ до Apple Intelligence.
Особливо приємно було почути про власну модель генерації зображень Apple, яка, згідно з дослідженнями компанії, не поступається Dolly чи Midjourney. Поки що вона недоступна для публічного використання, але перспективи дуже цікаві.
І, звичайно, не можна забувати про оновлення Vision OS 2. Власники Vision Pro отримали оновлення, яке принесло більше комфорту та зручності. Найбільше вражає можливість розміщувати віджети в просторі, які зберігаються у вашому реальному оточенні, навіть після вимкнення пристрою. Наприклад, ви можете прив’язати вікно у віртуальному просторі до стіни, і воно завжди буде там, показуючи вам, наприклад, краєвиди Гаваїв. А ще, з’явилися покращення у співпраці, коли користувачі бачать один і той же контент, що надзвичайно зручно для спільної роботи чи перегляду фільмів. Яскравішою стала і 3D-візуалізація простору.
Meta та амбітні плани
Цього тижня Мета зробила гучну заяву – намір інвестувати майже $15 мільярдів у 49% акцій Scale AI. Це компанія, що займається розміткою даних для навчання моделей штучного інтелекту. Фактично, це означає, що Meta отримає вирішальний вплив на діяльність компанії, яка співпрацює з усіма найбільшими гравцями ринку AI, включаючи OpenAI та Microsoft.
Олександр Ван, CEO Scale AI, може очолити новий підрозділ Meta, який спеціалізуватиметься на “суперінтелекті”. Хоча в цілому це може викликати деяке занепокоєння у інших гравців. Розвиток штучного інтелекту в напрямку надлюдського розуму – це, безперечно, хвилюючий, але й дещо лякаючий крок.
Відео AI: Від метаморфоз до оцінки
Цього тижня ми стали свідками нових захопливих кроків у світі відео AI.
Мета випустила нову функцію, що дозволяє редагувати відео за допомогою Meta AI. Тепер можна застосовувати готові стилі, змінюючи одяг, локацію, освітлення тощо. Це досить просто, враховуючи, що можна обрати лише з обмеженого набору стилів. Можна, наприклад, накинути на себе “хутряну шубу” або перетворитися в “злу відьму”.
Midjourney, нарешті, розпочала період оцінювання відео. Користувачі, що мають підписку, можуть брати участь, обираючи з двох відео, які згенерував сервіс. Завдяки цьому система навчається та адаптується до вподобань користувачів. Можливо, незабаром ми отримаємо можливість згенерувати відео за промптом.
Також Google оновила свій V3 відеогенератор. Він став у два рази швидшим, отримав підтримку 720p роздільної здатності, та ще більше привілеїв для Gemini Pro користувачів. А користувачі Leonardo AI також можуть генерувати відео за допомогою V3.
Microsoft, OpenAI та драма світу AI
Microsoft представила Copilot Vision. Це інструмент, який дозволяє AI «бачити» вміст вашого екрану та надавати покрокові інструкції для роботи з програмами. Схоже на інтерактивний навчальний посібник.
OpenAI також оголосили про те, що їхня модель openweight потребує більше часу для завершення, і анонсували затримку релізу. OpenAI, немовби нагадує нам про те, що потрібно завжди очікувати сюрпризи.
Тиждень також ознаменувався збоєм у роботі ChatGPT. Світ, що звик до швидких відповідей, пережив справжню паніку, тимчасово втративши можливість генерувати контент.
Я не можу обійти увагою і певну драму.
-
По-перше*, директор з робототехніки Tesla покинув компанію. Хоча, офіційно, він вирішив більше часу приділити сім’ї, лунають припущення й про незгоду з поточним курсом компанії.
-
По-друге*, колишній інженер Tesla створив свій стартап з розробки гуманоїдних роботів. У Tesla, зрозуміло, розлютилися, і подали до суду.
-
По-третє*, Midjourney судяться з Disney та Universal про неправомірне використання інтелектуальної власності. Наразі, дуже важко визначити межу між натхненням та прямим копіюванням.
Швидкий вогонь
- Google розширює функції планування в Gemini. Тепер Gemini може планувати завдання та створювати повторювані дії.
- Google представила оновлену функцію аудіо-огляду в пошуку.
- У Китаї під час іспитів було тимчасово призупинено використання AI.
- Mistral AI випустила Magistrol – модель, що спеціалізується на міркуванні.
- Google DeepMind представила інтерактивний веб-сайт для обміну моделями погоди.
- Samsung почав вбудовувати AI в холодильники. Відтепер холодильник може знати, хто з членів сім’ї стоїть перед ним.
Космічні Штурмовики та майбутнє
Я не можу не згадати про абсолютно феноменальне явище: Instagram-канал “Stormtrooper Vlogs”, який з неймовірною швидкістю набирає підписників, використовуючи Star Wars IP та AI-генеровані відео! Наразі, юристи та фахівці з інтелектуальної власності збираються працювати над рішенням.
Ось такою була тижня, повна нових відкриттів, ризикованих експериментів та захопливих перспектив. Штучний інтелект неухильно проникає у всі сфери нашого життя, від перекладу до розваг, від освіти до медицини. Ми стоїмо на порозі захопливого нового світу, і я з нетерпінням чекаю можливості дослідити його разом з вами.
Дякую, що були зі мною! До наступної зустрічі!