“Gen-4: Революція у світі ШІ-відео? Перші враження від Runway ML”
У світі штучного інтелекту (ШІ) знову вирує хвиля змін. Цього разу, у центрі уваги – Runway ML, компанія, яка не потребує представлення серед розробників інструментів для генерації відео за допомогою ШІ. Їхній новий продукт, Gen-4, вже наробив чимало галасу, і не безпідставно.
Уявіть собі дюни, охоплені піщаною бурею, де кожен подих вітру відчувається на екрані. Або ж дівчину, яка блукає лісом, занурюючись у його таємничі глибини. Або навіть гігантські споруди, що вражають своєю величчю на тлі безмежної пустелі. Все це – не кадри з голлівудського блокбастера, а візуалізації, створені Gen-4.
Особливої уваги заслуговує реалістичність. Рух тканини, відблиски світла, навіть найдрібніші деталі – все це відтворено з дивовижною точністю. Але справжнім проривом стало відтворення руху тварин. Погляньте на того грифа, як він розправляє свої крила, відчуваючи порив вітру. Це не просто анімація, це – магія ШІ.
І що найважливіше – відсутність “ШІ-шного” сміття. Ніяких розмитих плям, ніяких галюцинацій. Лише чіткість, визначеність і професійний рівень.
Runway ML завжди вирізнялася у цьому аспекті. Вони розуміють, що якість – понад усе. І Gen-4 – яскраве тому підтвердження.
Ракета, що злітає у небо, медуза, що граційно пливе у морській глибині, сірий мавпеня, що зачаровує своєю милістю – Gen-4 відкриває безмежні можливості для творчості. Абстрактні концепції стають реальністю, а рух перетворюється на мистецтво.
Руйнування мосту, звісно, виглядає ще трохи “сирим”, однак усе ще захоплює своїм масштабом.
Найкраща новина – Gen-4 доступний для всіх. Ніяких списків очікування, ніяких обмежень. Бери і твори.
З Gen-3 до Gen-4 – менше року. І це вражає! Адже Runway ML не просто випускає нові версії, вони постійно вдосконалюють попередні, додаючи нові можливості.
На сайті Runway ML можна знайти безліч прикладів робіт, створених за допомогою Gen-4. Кумедний персонаж, що ласує полум’ям, милий скунс у зоопарку Нью-Йорка, стадо тварин у дикій природі – все це вражає своєю деталізацією і реалістичністю.
Gen-4 позиціонується як найбільш послідовна та контрольована модель відео. Тривалість відео – до 10 секунд. Хотілося б, звісно, більше, але і це вже непогано.
Підтримується завантаження зображень. Завантажуємо, обрізаємо до потрібного формату (16:9, 21:9, 4:3, і навіть портретні формати) – і вперед, до творчості!
Ось приклад: людина дивиться в камеру, а потім тікає вдалечінь. Камера віддаляється, показуючи пейзаж. Звучить просто, але результат вражає.
Або ж інший приклад: автомобіль, навколо якого обертається камера. Автомобіль зривається з місця, залишаючи за собою слід диму та вогню. Кінематографічно!
Час генерації досить швидкий. Це приємно дивує, особливо в порівнянні з повільною генерацією зображень у GPT-4 Omni.
Отже, тест. Людина дивиться в камеру і тікає. Рух виглядає природно, пил з-під ніг летить в усі боки. Все чудово, але є одне “але”: у персонажа немає руки. Зображення було згенеровано GPT-4 Omni, і він зумів створити безрукого чоловіка. Але Gen-4 вирішив виправити “помилку” і повернув йому руку. Це, звісно, не критично, але показує, що ще є над чим працювати.
Збільшення роздільної здатності до 4K – ще одна корисна функція. Хоча вона і не робить дива з якістю руху, але додає деталізації.
А що буде, якщо порівняти Gen-4 з Gen-3? Різниця очевидна. Gen-4 – це величезний стрибок вперед. Якість, деталізація, реалістичність – все набагато краще.
Спробуємо згенерувати щось більш складне. Наприклад, вантажівка пробиває стіну за спиною людини. Людина озирається, а потім дивиться в камеру з тривогою. Простий сюжет, але цікаво, як з ним впорається Gen-4.
Або ж тисячі лимонів падають з неба на людину, яка радіє цьому. Це вже виклик для фізики!
А ось ще один приклад: моторошні VHS-кадри, на яких людина одержима лимонами. Тут потрібно передати атмосферу жаху і абсурду.
І наостанок – 3D-анімація. Милий робот летить на ракеті в космос, приземляється на Місяць і виходить з ракети. Мило і зворушливо.
Результати вражають, але не завжди відповідають очікуванням. Вантажівка, наприклад, не пробиває стіну, а просто з’являється в кімнаті. Але інколи все ж пробивається в кадр.
А лимони? Вони падають з неба і утворюють купу перед людиною. Фізика працює, але деталізація залишає бажати кращого. Проте, виглядає досить реалістично, як би воно було в житті.
А моторошні VHS-кадри? Тут Gen-4 перевершив себе. Атмосфера жаху, абсурду і одержимості – все передано на відмінно.
Найбільше вражає здатність Gen-4 передавати емоції персонажів. Навіть у простого робота можна побачити радість, здивування і зацікавленість. Це – справжній прорив.
З мінусів: потреба у вхідному зображенні. Gen-4 не може генерувати відео з нуля, йому потрібен “стартовий” кадр. Але це не проблема, адже завжди можна скористатися вбудованим генератором зображень або ж іншими сервісами, наприклад, idiogram AI.
Ну і наостанок – макрозйомка. На жаль, Gen-4 не зміг реалізувати цю ідею. Він не зміг збільшити масштаб до молекул, а просто створив абстрактний візерунок.
Що ж, перше враження від Runway Gen-4 – позитивне. Це – вражаюча модель, яка показує чудові результати у відтворенні реалізму, 3D-анімації та емоцій персонажів. Звісно, є ще над чим працювати, але потенціал величезний.
Gen-4 – це не просто інструмент, це – партнер для творчості. Він відкриває нові можливості для створення фільмів, анімації та інших видів візуального мистецтва. І хто знає, можливо, саме Gen-4 стане тим самим “двигуном”, який приведе нас до нової ери в кінематографі.