З Midjourney дивіться, у серце візуального наративу: Перші враження. Та перспективи відеогенерації
Привіт, шановні читачі мого блогу! З вами Ліла Гарт, і сьогодні я з головою пірнула. У захоплюючий світ уявіть собі, візуального оповідання, що створюється за допомогою штучного інтелекту. Я вже давно захоплююсь тим, як технології перетворюють наш погляд на мистецтво, і, повірте, новина про вихід Midjourney Video стала для мене справжнім святом.
У цьому огляді я постараюся передати вам свої враження, поділитися деякими хитрощами та, звісно, кинути погляд на те, що нас чекає попереду у всесвіті відео, створеного ШІ. Також я не змогла пройти повз анонс нового творчого відеоапскейлера від Topaz, який, схоже, стане незамінним помічником у цій захоплюючій грі.
Тріумф Midjourney: Відео відкриває нові горизонти
Складається враження, що Midjourney по-справжньому розкриває свій потенціал! Дивно, сам факт випуску відеогенерації вже викликає захоплення. Цей розумієте, інструмент не просто “добрий”, він – шалено захоплюючий!
Насамперед, слід відмітити важливий момент – цінову політику Midjourney. Розробники вирішили тримати ціни на генерацію відео на низькому рівні. Безумовно, це чудовий підхід, який робить інструмент більш доступним. Але є й зворотний бік медалі: відео, що генеруються. Мають досить низьку роздільну здатність – всього 480 пікселів. Очевидно, та не варто впадати у відчай, в такому дусі. У сучасному світі є безліч чудових інструментів для апскейлінгу, і. Про один з них, як ви вже здогадались, піде мова далі.
Одразу ж кинусь у приклади оскільки пам’ятаєте ті американські весільні каплиці Лас-Вегасу? Так от, Midjourney згенерував чудову картинку саме такої каплиці, куди, здається, ось-ось увійде наречена, аби постати перед вівтарем.
Доступні режими генерації: auto (низька або висока динаміка) та manual. Простіше кажучи, у першому випадку Midjourney розробляє відео на основі того, що бачить, а в другому – ви маєте більше контролю над промптами. Я спробувала автоматичний режим з низькою динамікою, і отримала. П’ять секунд дивовижного відео, схожого на кадри з дрона.
Звісно, 480p – це не найкращий варіант, приблизно так. Але, як я вже згадувала, тут на допомогу приходять інструменти для апскейлінгу. Дивно, я скористалась звичайним Topaz (не креативним) та отримала пристойний результат, що чудово підійшов для презентації.
Анімація образів: Емоції, сюжети та безмежний простір для творчості
На сцену виходить наречена. Але не просто наречена, а жінка у розкішній червоній сукні, яка, згідно з промптом, відчуває тривогу перед майбутнім весільним обрядом. І поруч з нею – наречений у зеленому смокінгу. Цікаво, що з цього вийде? Очевидно,
Коли я спробувала анімувати зображення у режимі auto з низькою динамікою, результат вразив! Midjourney, здається, не просто розумієте, аналізує зображення, а й тонко відчуває закладений у промт емоційний підтекст. Рухи нареченої виражають саме те, що я хотіла передати – її сумніви та переживання.
Щодо хлопця у зеленому смокінгу, він, схоже, взагалі не розуміє, що відбувається.
Перейшовши в режим manual, я вирішила зайти ще далі. Зміна в промті на фразу “наречена от, тікає” створила справжню сцену втечі з-під вінця! Чоловік у синьому костюмі, певно, зітхнув з полегшенням, або, може, все ще грає в автомати в казино, приблизно так.
Множинність версій: Перевага у різноманітності
Ще один чудовий. Аспект Midjourney Video – можливість генерації до чотирьох відео одночасно. Це суттєво збільшує шанси знайти саме той кадр, який вам потрібен. Зазвичай, обиратись між двома версіями, що вже є великим плюсом.
Магія в деталях: Руки, емоції та чарівність
Midjourney Video дивовижно добре справляється з руками. Відверто кажучи, це те, що мене найбільше вразило! У першому відео, яке я ну, подивилась, пальці не перетворились в. Щось страшне, туманне і химерне, як це часто буває з ШІ-генераторами.
рекомендую повернутись до старих зображень, згенерованих раніше, та. Просто запустити їх слухайте, в режимі auto (низька або висока динаміка). Часто Midjourney ловить ті деталі, яких не вистачало в першоджерелі. Відверто кажучи,
Наприклад, був у мене герой. Із мечем, але самого меча на зображенні не було. Після запуску у відеорежимі цей меч з’явився. Справа в тому, що класика: герой кидає виклик, і. Навряд чи переможе.
Емоції та рухи персонажів – ще один козир Midjourney. Згадаймо, приміром, воїна-вікінга, який з криком “Вальгалла! ” йде назустріч смерті. Або, як приклад, кіберпанк Джон Вік, що збирається “навести порядок” в якомусь магазині. Щоб було ясно,
Звісно, не все ідеально. Іноді трапляються невеликі проблеми й “ступор”. Наприклад, періодично з’являється кіберпанкова леді з довгою сивою косою, що прогулюється вулицею. Щоб було ясно,
Але що мене дійсно дивує, так це здатність Midjourney до. Генерації специфічних елементів дизайну, характерних для самого Midjourney, які органічно вписуються в загальний світ відео.
Ще один приклад – сцена з кримінальної. Драми, немов взята з одного з найпопулярніших стрімінгових сервісів. Все так добре! Чесно кажучи, навіть поява припустимо, помічника режисера в кадрі не викликає жодних питань! Але хлопця швидше за все звільнять.
Дія та емоції у кадрі – новий рівень виразності
Велика кількість тестів з бійками в стилі кунг-фу вражають! Фактично, не ідеально, але енергія, чудові ракурси та загальна динаміка роблять ці сцени дуже привабливими. Безумовно,
хочу відмітити чудову анімацію маленької дівчинки, що вирушає на шлях помсти. Добре, що Midjourney не генерує звук, бо інакше, я б точно чула той крик.
Цікавий момент із “дівчинкою з вогнеметом”: уявіть собі, текст, що періодично з’являється в кадрі, залишається нерозбірливим, але стилістично відповідає загальній картинці. До речі,
Ще один приклад – королева-варварка з загону орків. У неї іноді спостерігається “затримка кроку”, але фонові орки залишаються цілісними. Вони не зливаються, виглядають так, ніби вони справді в костюмах.
Стилізація та анімаційні виходи – політ фантазії
Можливості для створення унікального відеоконтенту вражають. Наприклад, перетинаємо любов до піратів та кіберпанку, і отримуємо кіберпанкового пірата.
В режимі manual з низькою динамікою, я додала промпт “панорама вліво, відкривається кіберпанковий піратський корабель”. І отримую панораму, де з’являється піратський корабель у кіберпанковому стилі. Детальностю я не переймалась, але результат є! Насправді,
Стилізовані та дивіться, анімаційні роботи – ще один коник Midjourney. Генерація темних приблизно, лісів, з персонажем, втраченим десь у хащах, десь так.
Особливо добре вдаються гібриди в стилі CGI та stop-motion – казкові та дивовижні. Зрозуміло, і навіть якщо десь меч раптово з’являється, не звертайте на це уваги. Більше того, головне – це персонаж, його рухи та загальний стиль, десь так.
Звісно, може знадобитися кілька спроб або навіть використання додаткових інструментів. Щоб було ясно, але в результаті ви отримаєте шаленого божевільного Капелюшника, типу того. Або ще якусь дивовижну сцену. Простіше кажучи,
Не менш вражаючими є генерації дівчини, що грає на гітарі. Рухи справжні, гітара та пальці, як і годиться, стилістично витримані.
Спроби з використанням сучасного анімаційного стилю теж вражають. Цікаво, коментарі зайві.
Ще десь так, один цікавий момент – можливість просто. Залишити все на самоплив, і результат здивує вас. Справа в тому, що генеруючи чергове відео, я отримала дерево, що перетворилося на біомеханічну істоту. Я просто додала “extension” та отримала обійми двох дивних створінь. Очевидно, це дуже мило!
Midjourney Video – це інструмент для тих, хто прагне до спонтанності. Не завжди все буде так, як ви хочете. Відверто кажучи, але саме ця непередбачуваність робить його таким захоплюючим.
Тестування на різних версіях Midjourney: Старі добрі V4
Перш ніж. Випустити Midjourney Video, уявіть собі, розробники помітили, що модель найкраще працює з версією V4. І це мене дуже порадувало, бо ця версія – моя улюблена.
Почнімо с ретро-стиль Рідлі Скотта, з зневагою короля! Так, я чекаю, коли йому відрубають голову в кінці фільму! Разом з зерном та десатурацією кольорів, характерними для епохи! Виглядає вражаюче.
Ще один приклад – кортак у стилі Конана. Схоже, він заприсягнувся на вірність нашій справі! Зрозуміло, або сцени взагалі, з наприклад, фільму Даріо Ардженто “Suspiria” на стару модель. Здається, що відеомодель трохи “запозичує” риси обличчя персонажа з V4. Але мені дуже подобається розмитий, наче вазелін на лінзах, ефект, характерний для V4. Справа в тому, що результат чудовий!
Обмеження та “підводні камені”
Як і будь-яка технологія, Midjourney Video має свої обмеження.
Наприклад, у мене виникли певні труднощі із зображеннями. Особливо з дівчиною, яка неодноразово з’являлась у моїх постах. Більше того, дивно, і от, якщо ви хочете, щоб вона поцілувала камеру – вам доведеться пошукати інший сервіс.
Ще один приклад. Сцена з часів “холодної війни” та шпигунськими іграми. Мій герой повинен був вистрілити в іншого, але відеомодель “сказала ні”.
слухайте,
Окрім цього, на етапі тестування стилізації виникли проблеми. Герої рухались лише в останню мить перед тим, як мав їх розчавити гігантський робот! Але модель відхилила мій запит.
Але от, ось що цікаво: після повторного запуску видало просто поганий результат. Робот почав рухатись у зворотному напрямку бо очевидно, що модель навчається.
З Keanu Reeves як Джона Віка теж нічого не вийшло, в такому дусі. Що ж, лишається дивитись реальні фільми. До речі,
Хитрощі та корисні поради
- 360 degrees обертання. Більше того, Хочете, щоб ваш персонаж гарно літав та просто додайте в промпт 360 degrees rotation. Єдине: предмети, наприклад, розумієте, меч, можуть трохи “танцювати” хоча
- Плануйте свій час. Незважаючи розумієте, на доступність, час генерації у Midjourney згорає дуже швидко, особливо коли захоплюєшся. Найкраще – увійти в налаштування та помітити, щоб швидкість була низькою (relax). Генерація займе більше часу, але ви не витратите свої “швидкі години”. Дивно,
Підсумок: Досвід, що надихає
скажімо,
Midjourney Video – безумовно, не “генератор відео, що буде правити світом”. Йому ще бракує певних “фішок”. Але він вражає. Його секретний загалом, успіх – стилістична цілісність, навіть під час численних розширень, якось так.
– респект Midjourney за цей чудовий запуск. Новий продукт перевершив усі мої сподівання.
Topaz Astra: припустимо, Нова ера апскейлінгу
Ну, і трохи про Topaz Astra – креативний відеоапскейлер. Чим це корисно та просто Midjourney видає відео лише 480p. І саме час спробувати Astra бо
У мене є доступ до бета-версії. Після завантаження відео, користувачу пропонують вибрати між режимами precise (точний) або creative (творчий). У кожному з них можна налаштувати швидкість та якість.
Почнем з нашого розлюченого короля але ось кадр 480р. Запускаємо через Astra + Creative Bold оскільки результат вражає. Відверто кажучи, все виглядає, як HD-ремастер старого фільму та
Є свої нюанси. Очевидно, наприклад, з піратом і Creative Bold забрав у нього маску.
Тож, бачите, довелося використовувати precise quality, щоб зберегти оригінальну версію. Безумовно,
З “Останньою битвою найтупішого лицаря у світі” все запрацювало просто чудово.
В загальному, все виглядає фантастично!
Єдине, що треба сказати: вікінги потребували покращення. Більше того, після precise quality, він став надто “добрим та чистим”.
цей інструмент обов’язково варто спробувати. Дивно, я, звісно, теж про це повідомлю, коли його буде офіційний реліз.
І наостанок: дякую за увагу! З вами слухайте, була Ліла Гарт, натхненна цим захоплюючим світом візуального ШІ, десь так. До нових зустрічей!