“Gen-4: Революція у світі ШІ-відео? Перші враження від Runway ML”
У світі штучного інтелекту (ШІ) знову вирує хвиля змін. Цього разу, у центрі уваги – Runway ML, компанія, яка не потребує представлення серед розробників інструментів для генерації відео за допомогою ШІ. Їхній новий продукт, Gen-4, вже наробив чимало галасу, і не безпідставно.
Уявіть собі дюни, охоплені піщаною бурею, де кожен подих вітру відчувається на екрані. Або ж дівчину, яка блукає лісом, занурюючись у його таємничі глибини. Цікаво, або навіть гігантські споруди, що вражають своєю величчю на тлі безмежної пустелі, в такому дусі. Все це – не кадри з голлівудського блокбастера, а візуалізації, створені Gen-4.
Особливої уваги заслуговує реалістичність. Зрозуміло, рух тканини, відблиски світла, навіть найдрібніші деталі – все це відтворено з дивовижною точністю. Але справжнім проривом стало відтворення руху тварин. Погляньте на того грифа, як він розправляє свої крила, відчуваючи порив вітру. Це скажімо, не просто анімація, це – магія ШІ.
І що найважливіше – відсутність “ШІ-шного” сміття. Ніяких розмитих плям, ніяких галюцинацій тому лише чіткість, визначеність і професійний рівень.
Runway ML завжди вирізнялася у цьому аспекті. Вони розуміють, що якість – понад усе тому і Gen-4 – яскраве тому підтвердження.
Ракета, що злітає у небо, медуза, що граційно пливе у морській глибині, сірий мавпеня, що зачаровує своєю милістю – Gen-4 відкриває безмежні можливості для творчості. Безумовно, абстрактні концепції стають реальністю, а рух перетворюється на мистецтво, щось на зразок.
Руйнування мосту, звісно, виглядає ще трохи “сирим”, однак усе ще захоплює своїм масштабом.
Найкраща новина – Gen-4 доступний для всіх. Ніяких списків очікування, ніяких обмежень. Бери і твори.
З Gen-3 до Gen-4 – менше року. І це вражає! Адже Runway ML не просто випускає нові версії, вони постійно вдосконалюють попередні, додаючи нові можливості. От,
На сайті Runway бачите, ML можна знайти безліч прикладів робіт, створених за допомогою Gen-4. Кумедний персонаж, що ласує полум’ям, милий скунс у зоопарку Нью-Йорка, стадо. Тварин у дикій дивіться, природі – все це вражає своєю деталізацією і реалістичністю.
Gen-4 позиціонується як найбільш послідовна та контрольована модель відео, якось так. Тривалість відео – до 10 секунд. Простіше кажучи, хотілося б, звісно, більше, але і це вже непогано.
Підтримується завантаження зображень. Завантажуємо, обрізаємо до потрібного формату (16:9, 21:9, 4:3. І навіть портретні формати) – і вперед, до творчості!
Ось приклад: людина дивиться в камеру, а потім тікає вдалечінь. Камера віддаляється, показуючи пейзаж. Звучить просто, але результат вражає.
Або ж інший приклад: автомобіль, навколо якого обертається камера, приблизно так. Автомобіль зривається з місця, залишаючи за собою слід диму та вогню. Кінематографічно!
Час генерації досить швидкий. Це приємно дивує, особливо в порівнянні з повільною генерацією зображень у GPT-4 Omni.
Отже, тест. Насправді, людина дивиться в камеру і тікає. До речі, рух виглядає природно, пил з-під ніг летить в усі боки. Все чудово, наприклад, але є одне “але”: у персонажа немає руки. Зображення було згенеровано GPT-4 Omni, і він зумів створити безрукого чоловіка. Дивно, але Gen-4 вирішив виправити “помилку” і повернув йому руку. Це, звісно, не критично, але показує, що ще є над чим працювати.
Збільшення роздільної здатності до 4K – ще одна корисна функція. Хоча вона і слухайте, не робить дива з якістю руху, але додає деталізації.
А що буде, якщо порівняти Gen-4 з Gen-3? Різниця очевидна але Gen-4 – це величезний стрибок вперед, десь так. Якість, деталізація, реалістичність – все набагато краще.
Спробуємо згенерувати щось більш складне проте наприклад, вантажівка пробиває стіну за спиною людини. Людина озирається, а потім дивиться в камеру з тривогою. Простий сюжет, але цікаво, як з ним впорається Gen-4.
Або ж тисячі лимонів падають з неба на людину, яка радіє цьому. Це вже виклик для фізики!
А ось ще один приклад: моторошні VHS-кадри, на яких людина одержима лимонами. Насправді, тут потрібно передати атмосферу жаху і абсурду.
І наостанок – 3D-анімація. Милий робот летить на ракеті в космос, приземляється на Місяць і виходить з ракети. Мило і зворушливо.
Результати дивіться, вражають, але не завжди відповідають очікуванням. Вантажівка, наприклад, не пробиває стіну, а просто з’являється в кімнаті. Але інколи все ж пробивається в кадр.
А лимони? Вони падають з неба і утворюють купу перед людиною. Фізика працює, але деталізація залишає бажати кращого, якось так. Проте, виглядає досить реалістично, як би воно було в житті.
А моторошні VHS-кадри проте тут Gen-4 перевершив себе. Атмосфера жаху, абсурду і одержимості – все передано на відмінно.
Найбільше вражає здатність Gen-4 передавати емоції персонажів. Навіть у простого робота можна побачити радість, здивування і зацікавленість. Це – справжній прорив та
З мінусів: потреба у вхідному зображенні. Gen-4 не може генерувати відео з нуля, йому потрібен “стартовий” кадр. Насправді, але це не проблема, адже завжди можна скористатися вбудованим генератором зображень або ж іншими сервісами, наприклад, idiogram AI.
Ну і наостанок – макрозйомка. На жаль, Gen-4 не зміг реалізувати цю ідею. Він не зміг збільшити масштаб до молекул, а просто створив абстрактний візерунок.
Що ж, перше враження від Runway Gen-4 – позитивне. Це – вражаюча модель, яка показує чудові результати у відтворенні реалізму, 3D-анімації та емоцій персонажів. Звісно, є ще над чим працювати, але потенціал величезний.
Gen-4 – це не просто інструмент, це – партнер для творчості. Він відкриває нові можливості для створення фільмів, анімації та інших видів візуального мистецтва. І хто знає, можливо, от, саме Gen-4 стане тим самим “двигуном”, який приведе нас до нової ери в кінематографі, щось на зразок.