З Midjourney у серце візуального наративу: Перші враження та перспективи відеогенерації
Привіт, шановні читачі мого блогу! З вами Ліла Гарт, і сьогодні я з головою пірнула у захоплюючий світ візуального оповідання, що створюється за допомогою штучного інтелекту. Я вже давно захоплююсь тим, як технології перетворюють наш погляд на мистецтво, і, повірте, новина про вихід Midjourney Video стала для мене справжнім святом.
У цьому огляді я постараюся передати вам свої враження, поділитися деякими хитрощами та, звісно, кинути погляд на те, що нас чекає попереду у всесвіті відео, створеного ШІ. Також я не змогла пройти повз анонс нового творчого відеоапскейлера від Topaz, який, схоже, стане незамінним помічником у цій захоплюючій грі.
Тріумф Midjourney: Відео відкриває нові горизонти
Складається враження, що Midjourney по-справжньому розкриває свій потенціал! Сам факт випуску відеогенерації вже викликає захоплення. Цей інструмент не просто “добрий”, він – шалено захоплюючий!
Насамперед, слід відмітити важливий момент – цінову політику Midjourney. Розробники вирішили тримати ціни на генерацію відео на низькому рівні. Безумовно, це чудовий підхід, який робить інструмент більш доступним. Але є й зворотний бік медалі: відео, що генеруються, мають досить низьку роздільну здатність – всього 480 пікселів. Та не варто впадати у відчай! У сучасному світі є безліч чудових інструментів для апскейлінгу, і про один з них, як ви вже здогадались, піде мова далі.
Одразу ж кинусь у приклади. Пам’ятаєте ті американські весільні каплиці Лас-Вегасу? Так от, Midjourney згенерував чудову картинку саме такої каплиці, куди, здається, ось-ось увійде наречена, аби постати перед вівтарем.
Доступні режими генерації: auto (низька або висока динаміка) та manual. У першому випадку Midjourney розробляє відео на основі того, що бачить, а в другому – ви маєте більше контролю над промптами. Я спробувала автоматичний режим з низькою динамікою, і отримала… п’ять секунд дивовижного відео, схожого на кадри з дрона.
Звісно, 480p – це не найкращий варіант. Але, як я вже згадувала, тут на допомогу приходять інструменти для апскейлінгу. Я скористалась звичайним Topaz (не креативним) та отримала пристойний результат, що чудово підійшов для презентації.
Анімація образів: Емоції, сюжети та безмежний простір для творчості
На сцену виходить наречена. Але не просто наречена, а жінка у розкішній червоній сукні, яка, згідно з промптом, відчуває тривогу перед майбутнім весільним обрядом. І поруч з нею – наречений у зеленому смокінгу… Цікаво, що з цього вийде?
Коли я спробувала анімувати зображення у режимі auto з низькою динамікою, результат вразив! Midjourney, здається, не просто аналізує зображення, а й тонко відчуває закладений у промт емоційний підтекст. Рухи нареченої виражають саме те, що я хотіла передати – її сумніви та переживання.
Щодо хлопця у зеленому смокінгу, він, схоже, взагалі не розуміє, що відбувається.
Перейшовши в режим manual, я вирішила зайти ще далі. Зміна в промті на фразу “наречена тікає” створила справжню сцену втечі з-під вінця! Чоловік у синьому костюмі, певно, зітхнув з полегшенням, або, може, все ще грає в автомати в казино.
Множинність версій: Перевага у різноманітності
Ще один чудовий аспект Midjourney Video – можливість генерації до чотирьох відео одночасно. Це суттєво збільшує шанси знайти саме той кадр, який вам потрібен. Зазвичай, обиратись між двома версіями, що вже є великим плюсом.
Магія в деталях: Руки, емоції та чарівність
Midjourney Video дивовижно добре справляється з руками. Відверто кажучи, це те, що мене найбільше вразило! У першому відео, яке я подивилась, пальці не перетворились в щось страшне, туманне і химерне, як це часто буває з ШІ-генераторами.
Крім того, рекомендую повернутись до старих зображень, згенерованих раніше, та просто запустити їх в режимі auto (низька або висока динаміка). Часто Midjourney ловить ті деталі, яких не вистачало в першоджерелі.
Наприклад, був у мене герой із мечем, але самого меча на зображенні не було. Після запуску у відеорежимі цей меч з’явився. Класика: герой кидає виклик, і… навряд чи переможе.
Емоції та рухи персонажів – ще один козир Midjourney. Згадаймо, приміром, воїна-вікінга, який з криком «Вальгалла!» йде назустріч смерті. Або, як приклад, кіберпанк Джон Вік, що збирається «навести порядок» в якомусь магазині.
Звісно, не все ідеально. Іноді трапляються невеликі проблеми й «ступор». Наприклад, періодично з’являється кіберпанкова леді з довгою сивою косою, що прогулюється вулицею.
Але що мене дійсно дивує, так це здатність Midjourney до генерації специфічних елементів дизайну, характерних для самого Midjourney, які органічно вписуються в загальний світ відео.
Ще один приклад – сцена з кримінальної драми, немов взята з одного з найпопулярніших стрімінгових сервісів. Все так добре! Навіть поява помічника режисера в кадрі не викликає жодних питань! Але хлопця швидше за все звільнять.
Дія та емоції у кадрі – новий рівень виразності
Велика кількість тестів з бійками в стилі кунг-фу вражають! Не ідеально, але енергія, чудові ракурси та загальна динаміка роблять ці сцени дуже привабливими.
Крім того, хочу відмітити чудову анімацію маленької дівчинки, що вирушає на шлях помсти. Добре, що Midjourney не генерує звук, бо інакше, я б точно чула той крик…
Цікавий момент із «дівчинкою з вогнеметом»: текст, що періодично з’являється в кадрі, залишається нерозбірливим, але стилістично відповідає загальній картинці.
Ще один приклад – королева-варварка з загону орків. У неї іноді спостерігається «затримка кроку», але фонові орки залишаються цілісними. Вони не зливаються, виглядають так, ніби вони справді в костюмах.
Стилізація та анімаційні виходи – політ фантазії
Можливості для створення унікального відеоконтенту вражають. Наприклад, перетинаємо любов до піратів та кіберпанку, і отримуємо кіберпанкового пірата.
В режимі manual з низькою динамікою, я додала промпт «панорама вліво, відкривається кіберпанковий піратський корабель». І отримую панораму, де з’являється піратський корабель у кіберпанковому стилі. Детальностю я не переймалась, але результат є!
Стилізовані та анімаційні роботи – ще один коник Midjourney. Генерація темних лісів, з персонажем, втраченим десь у хащах.
Особливо добре вдаються гібриди в стилі CGI та stop-motion – казкові та дивовижні. І навіть якщо десь меч раптово з’являється, не звертайте на це уваги. Головне – це персонаж, його рухи та загальний стиль.
Звісно, може знадобитися кілька спроб або навіть використання додаткових інструментів. Але в результаті ви отримаєте шаленого божевільного Капелюшника! Або ще якусь дивовижну сцену.
Не менш вражаючими є генерації дівчини, що грає на гітарі. Рухи справжні, гітара та пальці, як і годиться, стилістично витримані.
Спроби з використанням сучасного анімаційного стилю теж вражають. Загалом, коментарі зайві.
Ще один цікавий момент – можливість просто залишити все на самоплив, і результат здивує вас. Генеруючи чергове відео, я отримала дерево, що перетворилося на біомеханічну істоту. Я просто додала «extension» та отримала обійми двох дивних створінь. Це дуже мило!
Midjourney Video – це інструмент для тих, хто прагне до спонтанності. Не завжди все буде так, як ви хочете. Але саме ця непередбачуваність робить його таким захоплюючим.
Тестування на різних версіях Midjourney: Старі добрі V4
Перш ніж випустити Midjourney Video, розробники помітили, що модель найкраще працює з версією V4. І це мене дуже порадувало, бо ця версія – моя улюблена.
Почнімо с ретро-стиль Рідлі Скотта, з зневагою короля! Так, я чекаю, коли йому відрубають голову в кінці фільму! Разом з зерном та десатурацією кольорів, характерними для епохи! Виглядає вражаюче.
Ще один приклад – кортак у стилі Конана. Схоже, він заприсягнувся на вірність нашій справі! Або сцени з фільму Даріо Ардженто «Suspiria» на стару модель. Здається, що відеомодель трохи «запозичує» риси обличчя персонажа з V4. Але мені дуже подобається розмитий, наче вазелін на лінзах, ефект, характерний для V4. Результат чудовий!
Обмеження та “підводні камені”
Як і будь-яка технологія, Midjourney Video має свої обмеження.
Наприклад, у мене виникли певні труднощі із зображеннями. Особливо з дівчиною, яка неодноразово з’являлась у моїх постах. І от, якщо ви хочете, щоб вона поцілувала камеру – вам доведеться пошукати інший сервіс.
Ще один приклад. Сцена з часів «холодної війни» та шпигунськими іграми. Мій герой повинен був вистрілити в іншого, але відеомодель “сказала ні”.
Окрім цього, на етапі тестування стилізації виникли проблеми. Герої рухались лише в останню мить перед тим, як мав їх розчавити гігантський робот! Але модель відхилила мій запит.
Але ось що цікаво: після повторного запуску видало просто поганий результат. Робот почав рухатись у зворотному напрямку. Очевидно, що модель навчається.
З Keanu Reeves як Джона Віка теж нічого не вийшло. Що ж, лишається дивитись реальні фільми.
Хитрощі та корисні поради
- 360° обертання. Хочете, щоб ваш персонаж гарно літав? Просто додайте в промпт 360° rotation. Єдине: предмети, наприклад, меч, можуть трохи «танцювати».
- Плануйте свій час. Незважаючи на доступність, час генерації у Midjourney згорає дуже швидко, особливо коли захоплюєшся. Найкраще – увійти в налаштування та помітити, щоб швидкість була низькою (relax). Генерація займе більше часу, але ви не витратите свої «швидкі години».
Підсумок: Досвід, що надихає
Midjourney Video – безумовно, не “генератор відео, що буде правити світом”. Йому ще бракує певних “фішок”. Але загалом, він вражає. Його секретний успіх – стилістична цілісність, навіть під час численних розширень.
Загалом – респект Midjourney за цей чудовий запуск. Новий продукт перевершив усі мої сподівання.
Topaz Astra: Нова ера апскейлінгу
Ну, і трохи про Topaz Astra – креативний відеоапскейлер. Чим це корисно? Просто Midjourney видає відео лише 480p. І саме час спробувати Astra.
У мене є доступ до бета-версії. Після завантаження відео, користувачу пропонують вибрати між режимами precise (точний) або creative (творчий). У кожному з них можна налаштувати швидкість та якість.
Почнем з нашого розлюченого короля! Ось кадр 480р. Запускаємо через Astra + Creative Bold. Результат вражає. Все виглядає, як HD-ремастер старого фільму.
Є свої нюанси. Наприклад, з піратом. Creative Bold забрав у нього маску.
Тож, довелося використовувати precise quality, щоб зберегти оригінальну версію.
З «Останньою битвою найтупішого лицаря у світі» все запрацювало просто чудово.
В загальному, все виглядає фантастично!
Єдине, що варто відмітити: вікінги потребували покращення. Після precise quality, він став надто «добрим та чистим».
Загалом, цей інструмент обов’язково варто спробувати. Я, звісно, теж про це повідомлю, коли його буде офіційний реліз.
І наостанок: дякую за увагу! З вами була Ліла Гарт, натхненна цим захоплюючим світом візуального ШІ. До нових зустрічей!