Весна у світі AI: Коли машини починають мріяти
Привіт, друзі! З вами Ліла Гарт, і сьогодні я ділюся враженнями від нового вибуху в дивовижному світі штучного інтелекту. Все літо було відчуття, ніби AI трохи притих у своєму розвитку, але схоже, що зараз на нас чекає справжній феєрверк новин та відкриттів. Готові вирушити в цю захоплюючу подорож? Тоді поїхали!
Грозовий фронт AI: Groq та його неймовірні можливості
Нещодавно з’явилася новина, яка змусила серця багатьох здригнутися від захоплення – мова про Groq. Якщо ви, як і я, слідкуєте за світом AI, то вже знаєте, що ця модель “вибухнула” і зараз лідирує в багатьох рейтингах. Вона, здається, не просто змагається з Google та OpenAI, а й наступає їм на п’яти. Але про все по порядку.
Groq вражає своїми результатами. Наприклад, вона показала майже 50% на тесті, аналогічному гуманітарному іспиту, в той час, як попередня версія показала лише 24.9%. А у тесті Arc AGI Groq взагалі подвоїла результат своїх попередників, досягнувши 16%. Ці цифри говорять самі за себе.
Окрім вражаючих результатів у тестах, спільнота штурмує Groq різними завданнями. І, повірте, результати просто захоплюють.
Кодинг нового рівня. Groq демонструє дивовижні здібності у сфері кодингу. Хоча команда XAI заявила, що незабаром з’явиться спеціалізована модель саме для кодування, вже зараз Groq вражає. Лише за 4 години вона змогла створити 3D-гру у жанрі шутер від першої особи! Модель автоматично брала текстури з онлайн ресурсів, вбудовувала їх у 3D-об’єкти та середовище без будь-якої затримки. Вона навіть імпортувала 3D-моделі з веб-сайтів безпосередньо в гру. Це приголомшливо! Гра має анімацію руху зброї в руці, індикатори здоров’я та боєприпасів, перешкоди та, звичайно ж, ворогів. Це вражає!
Фізика, яка здивує. Ще один приклад – створення інтерактивної 3D-симуляції чорної діри. Використані 3JS для рендерингу та власні GLSL шейдери, неймовірні деталі подій горизонту, зоряне поле та навіть акреційний диск. Навіть якщо ви, як і я, не розбираєтесь в астрономії, це виглядає надзвичайно круто!
Експерименти, що захоплюють. Користувачі активно експериментують з Groq. Наприклад, модель успішно помістила м’яч всередину обертового шестикутника, чого не вдалося зробити в Groq попередньої версії.
Анімація, від якої захоплює дух. Groq генерує 3D-анімації з детальними змінами перспективи, як-от “Hello World”, що складається з анімованих людей.
Якщо ви хочете поекспериментувати з Groq, рекомендую спробувати 3JS, Blender та симуляції фізики.
Відмінність від Opus, який вважається найкращим кодуючим AI на даний момент, полягає в тому, що Groq слабший у створенні інтерфейсів. Проте, в питаннях логіки та міркування – йому немає рівних.
Invido AI: Ваш особистий AI-двійник
Перед тим, як продовжити розмову про Groq, хочу поділитися цікавою новинкою – оновленням V4 від Invido AI. Тепер збагачувати контент з допомогою AI стало ще простіше. Головна фішка – AI-двійники, AI-ведучі для ваших відео. І знаєте, хто у мене тепер є свій? Я сама! Більше не потрібно стояти перед камерою! Просто вводите текст в Invido V4 – і ось я вже розповідаю будь-що, що вам потрібно!
Як це працює? Ви можете вибрати з готових AI-аватарів, але найцікавіше – створити свого власного. Ви просто завантажуєте відео, де ви говорите до камери, і через кілька хвилин ваш аватар готовий.
У Invido AI редагування таке ж просте, як введення тексту у рядок. Наприклад, я просто можу написати: “Зробити це відео французькою мовою”. І мій аватар заговорить французькою! Це відкриває нові можливості для спілкування та розширення аудиторії.
Створити AI-двійника можна безкоштовно. Але якщо ви плануєте займатися цим серйозно та навіть заробляти, вам варто розглянути Generative plan, за 100 доларів на місяць. Саме його я зараз і використовую. Величезне дякую Invido AI за підтримку!
Groq: Копати глибше
Повертаємося до Groq. У багатоагентній версії моделі час роботи сягає понад 200 хвилин! Я не знаю, яка була підказка, але це багато часу для роздумів. Схоже, що це новий рівень можливостей.
Ply знову порадував нас офіційним jailbreak для Groq. Він також поділився своїми міркуваннями. Groq, у версії Heavy, хоч і повільний, легко перемагає інші флагманські моделі, такі як 03 та Gemini 2.5 Pro, в деяких найскладніших тестах. Ply зазначає, що захисні механізми трохи чутливі до таких тем, як синтез хімічної зброї, але їх можна обійти за допомогою звичних трюків.
Незважаючи на неймовірні результати, Groq все ще має деякі недоліки, властиві іншим моделям, наприклад, 03 чи Gemini 2.5 Pro. На прикладі показали руку з шістьма пальцями, і Groq сказав, що їх п’ять. Як ви розумієте, 03 та Gemini 2.5 Pro також не впоралися з цим завданням.
Попри всі досягнення, Groq ще не є AGI. Хоча, за словами Jimmy Apple’s, одного з інсайдерів у світі AI, внутрішні тести вже показують на наявність GPT5, який можливо покаже результат 50% на гуманітарному іспиті. Очевидно, що гонка за якістю триває!
Video: Нова ера створення відео
Переходимо до наступної важливої теми – відео.
Google та Veo 3. Google нарешті випустив перший стартовий кадр на Veo 3. Тепер ви можете взяти будь-яке зображення та використовувати його як перший кадр для створення відео за допомогою Veo 3 AI. Це дає нам більше контролю над Veo 3. Можна створювати відео з однаковими персонажами, а можливо, навіть і з однаковими голосами.
Moon Valley та Mary Mari. Нова компанія представила нову відеомодель Mary Mari. Її називають першою у світі моделлю AI для професійного виробництва відео. Основна перевага – гарне дотримання підказок. Наприклад, модель показала чудову роботу в створенні сцени з фігурою в чорному плащі з ковбойським капелюхом, яка йде вузькою стежкою, оточеною квітами та пустельним пейзажем на задньому плані. Відео вийшло дуже кінематографічним.
Деталізація. Окрім гарної якості картинки, можна спостерігати відмінну деталізацію, реалістичну фізику, роботу з освітленням (зелені відблиски виглядають бездоганно!).
Контроль камери. Тепер ви можете взяти стартове зображення, перетворити його на 3D з допомогою AI, а потім змінювати позицію камери. Все це реалістично і працює доволі добре.
Траєкторія об’єкта. Можна вказати траєкторію руху об’єкта, що значно покращує фізику об’єктів у відео.
Ключові кадри. Модель дозволяє використовувати ключові кадри, що дає можливість плавно переходити з одного кадру в інший.
Reference image. Досить непогане відтворення обличчя жінки, навіть якщо є невеликі неточності.
Тренування пози. Можна завантажити відео з людиною, що виконує певні рухи та перенести ці рухи на reference image.
Очевидно, що розробники приділили багато уваги створенню вражаючих функцій, адже конкуренція у відео компаніях дуже висока.
Perplexity AI та Comet: AI-асистент у вашому браузері
Поговоримо про Perplexity AI, яка представила новий браузер Comet. Він заснований на Chromium, тому якщо ви користуєтесь Chrome, все повинно імпортуватись без проблем. Comet – це агентний AI-браузер. Він може:
Твітити за вас
Залишати коментарі на YouTube
Шукати та купувати товари
Планувати подорожі
Наразі важко сказати, чи стане Comet краще за Chatbot. Але це точно цікавий досвід. OpenAI теж працює над власним агентним AI-браузером, і Google не відстає.
Відновлення тексту з розмитих зображень
І ще одна дивовижна новинка – модель для відновлення тексту з розмитих зображень. Це щось неймовірне! Ось низькоякісне зображення, яке ми намагаємося відновити, ось метод diff bir, а ось новий метод tediff. Завдяки численним проходам, можна відновити текст Louis в Louis Vuitton та напис Center! Текстури, звичайно, не ідеальні, але для відновлення тексту це справжнє диво.
Mirage та Odyssey ML: AI у світі відеоігор
Останні новини – це інтерактивні моделі для відеоігор, що дуже цікаво.
Mirage. Це інтерактивна реалістична модель для відеоігор. Вона використовує AI для навчання на відео з гри та відтворення відео в реальному часі. Уявіть собі симулятор GTA 4 з AI. Це поки що лише концепт, але він демонструє потенціал AI-графіки майбутнього.
Odyssey ML. Це модель, що дуже схожа на Mirage, але використовує реальні зображення подорожей. Тобто, ви можете “прогулюватись” у реальному місті чи місці, як у відеоігрі.
У 2026 році ми побачимо багато такого інтерактивного відео. Наразі латентність у таких моделях – велика проблема.
Підсумки
Цей тиждень виявився дуже насиченим у світі AI. Groq змушує вражати своїми можливостями, з’являються нові компанії, що займаються відеомоделями. Є багато цікавих новинок, і це тільки початок! На нас чекають великі релізи, такі як GPT5, Gemini 3.0. Сподіваюсь, що і Sora порадує нас оновленнями. Я дуже чекаю на оновлення комп’ютерного використання. Хочу побачити агента, який зможе працювати з моїм комп’ютером!
Що ви думаєте про ці новини? Пишіть у коментарях.
Дякую за увагу, друзі! До нових зустрічей. Бувайте!