“Gen-4: Революція у світі ШІ-відео? Перші враження від Runway ML”

    У світі штучного інтелекту (ШІ) знову вирує хвиля змін. Цього разу, у центрі уваги – Runway ML, компанія, яка не потребує представлення серед розробників інструментів для генерації відео за допомогою ШІ. Їхній новий продукт, Gen-4, вже наробив чимало галасу, і не безпідставно.

    Уявіть собі дюни, охоплені піщаною бурею, де кожен подих вітру відчувається на екрані. Або ж дівчину, яка блукає лісом, занурюючись у його таємничі глибини. Цікаво, або навіть гігантські споруди, що вражають своєю величчю на тлі безмежної пустелі, в такому дусі. Все це – не кадри з голлівудського блокбастера, а візуалізації, створені Gen-4.

    Особливої уваги заслуговує реалістичність. Зрозуміло, рух тканини, відблиски світла, навіть найдрібніші деталі – все це відтворено з дивовижною точністю. Але справжнім проривом стало відтворення руху тварин. Погляньте на того грифа, як він розправляє свої крила, відчуваючи порив вітру. Це скажімо, не просто анімація, це – магія ШІ.

    І що найважливіше – відсутність “ШІ-шного” сміття. Ніяких розмитих плям, ніяких галюцинацій тому лише чіткість, визначеність і професійний рівень.

    Runway ML завжди вирізнялася у цьому аспекті. Вони розуміють, що якість – понад усе тому і Gen-4 – яскраве тому підтвердження.

    Ракета, що злітає у небо, медуза, що граційно пливе у морській глибині, сірий мавпеня, що зачаровує своєю милістю – Gen-4 відкриває безмежні можливості для творчості. Безумовно, абстрактні концепції стають реальністю, а рух перетворюється на мистецтво, щось на зразок.

    Руйнування мосту, звісно, виглядає ще трохи “сирим”, однак усе ще захоплює своїм масштабом.

    Найкраща новина – Gen-4 доступний для всіх. Ніяких списків очікування, ніяких обмежень. Бери і твори.

    З Gen-3 до Gen-4 – менше року. І це вражає! Адже Runway ML не просто випускає нові версії, вони постійно вдосконалюють попередні, додаючи нові можливості. От,

    На сайті Runway бачите, ML можна знайти безліч прикладів робіт, створених за допомогою Gen-4. Кумедний персонаж, що ласує полум’ям, милий скунс у зоопарку Нью-Йорка, стадо. Тварин у дикій дивіться, природі – все це вражає своєю деталізацією і реалістичністю.

    Gen-4 позиціонується як найбільш послідовна та контрольована модель відео, якось так. Тривалість відео – до 10 секунд. Простіше кажучи, хотілося б, звісно, більше, але і це вже непогано.

    Підтримується завантаження зображень. Завантажуємо, обрізаємо до потрібного формату (16:9, 21:9, 4:3. І навіть портретні формати) – і вперед, до творчості!

    Ось приклад: людина дивиться в камеру, а потім тікає вдалечінь. Камера віддаляється, показуючи пейзаж. Звучить просто, але результат вражає.

    Або ж інший приклад: автомобіль, навколо якого обертається камера, приблизно так. Автомобіль зривається з місця, залишаючи за собою слід диму та вогню. Кінематографічно!

    Час генерації досить швидкий. Це приємно дивує, особливо в порівнянні з повільною генерацією зображень у GPT-4 Omni.

    Отже, тест. Насправді, людина дивиться в камеру і тікає. До речі, рух виглядає природно, пил з-під ніг летить в усі боки. Все чудово, наприклад, але є одне “але”: у персонажа немає руки. Зображення було згенеровано GPT-4 Omni, і він зумів створити безрукого чоловіка. Дивно, але Gen-4 вирішив виправити “помилку” і повернув йому руку. Це, звісно, не критично, але показує, що ще є над чим працювати.

    Збільшення роздільної здатності до 4K – ще одна корисна функція. Хоча вона і слухайте, не робить дива з якістю руху, але додає деталізації.

    А що буде, якщо порівняти Gen-4 з Gen-3? Різниця очевидна але Gen-4 – це величезний стрибок вперед, десь так. Якість, деталізація, реалістичність – все набагато краще.

    Спробуємо згенерувати щось більш складне проте наприклад, вантажівка пробиває стіну за спиною людини. Людина озирається, а потім дивиться в камеру з тривогою. Простий сюжет, але цікаво, як з ним впорається Gen-4.

    Або ж тисячі лимонів падають з неба на людину, яка радіє цьому. Це вже виклик для фізики!

    А ось ще один приклад: моторошні VHS-кадри, на яких людина одержима лимонами. Насправді, тут потрібно передати атмосферу жаху і абсурду.

    І наостанок – 3D-анімація. Милий робот летить на ракеті в космос, приземляється на Місяць і виходить з ракети. Мило і зворушливо.

    Результати дивіться, вражають, але не завжди відповідають очікуванням. Вантажівка, наприклад, не пробиває стіну, а просто з’являється в кімнаті. Але інколи все ж пробивається в кадр.

    А лимони? Вони падають з неба і утворюють купу перед людиною. Фізика працює, але деталізація залишає бажати кращого, якось так. Проте, виглядає досить реалістично, як би воно було в житті.

    А моторошні VHS-кадри проте тут Gen-4 перевершив себе. Атмосфера жаху, абсурду і одержимості – все передано на відмінно.

    Найбільше вражає здатність Gen-4 передавати емоції персонажів. Навіть у простого робота можна побачити радість, здивування і зацікавленість. Це – справжній прорив та

    З мінусів: потреба у вхідному зображенні. Gen-4 не може генерувати відео з нуля, йому потрібен “стартовий” кадр. Насправді, але це не проблема, адже завжди можна скористатися вбудованим генератором зображень або ж іншими сервісами, наприклад, idiogram AI.

    Ну і наостанок – макрозйомка. На жаль, Gen-4 не зміг реалізувати цю ідею. Він не зміг збільшити масштаб до молекул, а просто створив абстрактний візерунок.

    Що ж, перше враження від Runway Gen-4 – позитивне. Це – вражаюча модель, яка показує чудові результати у відтворенні реалізму, 3D-анімації та емоцій персонажів. Звісно, є ще над чим працювати, але потенціал величезний.

    Gen-4 – це не просто інструмент, це – партнер для творчості. Він відкриває нові можливості для створення фільмів, анімації та інших видів візуального мистецтва. І хто знає, можливо, от, саме Gen-4 стане тим самим “двигуном”, який приведе нас до нової ери в кінематографі, щось на зразок.

    Поділитися.
    0 0 голоси
    Рейтинг статті
    Підписатися
    Сповістити про
    guest
    0 Коментарі
    Найстаріші
    Найновіше Найбільше голосів
    Зворотній зв'язок в режимі реального часу
    Переглянути всі коментарі
    0
    Буду рада вашим думкам, прокоментуйте.x