V3 з прискоренням: Швидко, Економно та (Не Зовсім) Переломлює Правила
Привіт, друзі! З вами Ліла Гарт, і сьогодні ми занурюємося у світ генеративного відео, де Google щойно випустив прискорений режим для V3. Так, ви правильно почули – “швидкість” і “V3” в одному флаконі! Аби не бути голослівним, я звернулася до самого Йєті, який, власне, і повідомив про це (хоч і з натяком на іронію): “V3 з прискоренням нарешті тут! Це круто, і коштує дешевше.”
Тепер, звісно, виникає питання: чи порушує це правило “швидко, дешево та добре, але обираєш два”? Давайте розберемось! Разом ми:
- Порівняємо швидкий режим з “Big Daddy” (як автор називає якісний режим).
- Поговоримо про ціну прискореного режиму (яке, сподіваюся, вас приємно здивує!).
- Розглянемо цікаву формулу підказок для V3 та одну велику хитрість, яку ви точно захочете знати.
Операція “Швидкість”: Чи Варто Воно Вашої Уваги?
Ще до офіційного виходу прискореного режиму, я вирішила поекспериментувати. І, знаєте що? Вийшло досить непогано! Але спочатку – трохи передісторії.
Автори відео вирішили створити оду на честь улюбленого серіалу “Твін Пікс”. Ось як виглядає перший результат (а далі буде ще цікавіше):
“У цьому місті є свої секрети, агенте. Але такого тут не стається. Я знайшов тіло. Воно було загорнуте у пластик. Розумієш, це місто – не таке, як інші місця. Сови не такі, як здаються. І кава… ну, вона теж має секрети. Це чудовий кухоль Джо. Ти дивишся не туди, агенте. Тобі треба бути в лісі, говорити з совами. Там – хатина. Чорна хатина. Ніколи не заходь туди. Обіцяєш? Ти захочеш це побачити, агенте…”
Так, трохи моторошно, але, на диво, досить атмосферно! Всі ці кліпи були згенеровані в V3 fast, хоча я і скористалася функцією Topaz upscale, аби покращити їх.
Битва Титанів: V3 Quality vs. V3 Fast
А тепер – справжнє випробування. Час для порівняння “лоб у лоб” між якісним режимом (який автор ласкаво називає “Big Daddy”) та прискореним.
Перший раунд: натхненна Fallout сцена.
- V3 Quality (“Big Daddy” mode): Загалом, досить непогано. Але є невеличка заминка з жіночим персонажем. Або вона просто спіткнулася об лозу. Також варто зазначити, що я просила діалог, але його не отримала. (Ймовірність отримати діалог у V3, як помітив автор, становить близько 25%.)
- V3 Fast: І тут починаються сюрпризи! (Він, до речі, відрізняється від “Big Daddy” тим, що ми отримали діалог!) Герої обох версій – як у якісному, так і в прискореному режимах – виглядають досить схоже! Навіть цифрові номери на броні героїв – ідентичні! (Хоча я цього не просила.)
Ось як виглядає прискорений режим:
“Потрібно бути обережними. Тут можуть бути бандити або й гірше… Завжди. Будьте пильні!”
Загалом, я схиляюся до думки, що швидкий режим – це той самий звичайний режим, але без одного-двох фінальних етапів обробки.
Ще один приклад: сцена, натхненна Джеймсом Бондом.
- V3 Quality: Виглядає добре, але ми отримуємо субтитри. І втрачаємо жарт…
- V3 Fast: “Маленька приємність для вашого зап’ястя, Бонде, якщо вам потрібно швидко піти…” Тут ми отримали і жарт, і ідеальні кадри!
Загалом, якщо оцінювати, я б віддала перевагу швидкісному режиму.
“Гра Престолів” зустрічає V3
І ще один приклад, натхненний “Іграми Престолів”:
- V3 Quality: Ми бачимо більше текстур, обличчя не такі розмиті, як у швидкому режимі. Але, знову ж таки, в якісному режимі ми отримуємо “обрізаний” кадр.
- V3 Fast: Сцена виглядає більш цілісною.
Ціна Питання: Швидкість Має Свою Вартість
Отже, як ви вже, напевно, здогадалися, прискорений режим доступний лише на платформі Flow. Я ще не бачила його в API. Але ціна – всього 20 кредитів за генерацію. Це означає, що ви можете отримати до 625 результатів, використовуючи V3 fast, на відміну від 125 на місяць у режимі V3 quality. Це великий стрибок!
Якби не режим fast, у мене б не вийшло створити коротке відео у стилі “Твін Пікс” (якщо рахувати загальну кількість генерацій, то, напевно, на рівні 103). Зважаючи на те, що це було перетворення тексту на відео, я зіткнулася зі стандартними проблемами:
- Послідовність персонажів.
- Труднощі з налаштуванням.
Як завжди, правильного чи неправильного способу підказок не існує.
JSON Магія: Підказки, Створені Для Вас
Але зараз зупинимось детальніше на цікавому форматі текстових підказок, який називається JSON (JavaScript Object Notation). Це, по суті, стандартний текстовий формат для представлення структурованих даних.
Особисто, я не думаю, що ви повинні писати це все самі. Саме тут вступає в гру LLM.
Як Це Працює?
Що я зробила – це створила інструкції для GPT або Gem, або будь-якої іншої LLM-ки, якою ви користуєтесь. Ці інструкції дозволять вам бути настільки вільними або конкретними, наскільки ви хочете. Ви навіть можете завантажити зображення, і LLM не тільки надасть вам текстову підказку, але й результат у форматі JSON. Таким чином, експериментуйте, щоб побачити, що виходить краще.
З цим форматом вийшло досить добре. І знову ж таки, я не давала жодних подробиць про те, що мала статися у відео. Я просто дала картинку та сказала: “Зроби щось!”.
Експерименти з Картинками: Як Зробити Зображення Живим
Ще одне цікаве відкриття V3, авторство якого належить Мартіну Небелонгу. Цей трюк працює лише в режимі V3 quality, але він може здивувати. Вам потрібно завантажити зображення персонажа на зеленому екрані. Потім напишіть:
[prompt] instantly jump/cut on frame one, two, and then whatever you want.
І, вуаля, ви збережете деталі персонажа! Ось результат.
Разом з V3, при перетворенні зображення на відео, ви, зазвичай, не отримуєте звук та діалоги.
Експериментуючи з цим, він отримав такий результат (але з кількома недоліками).
Я виявила, що краще генерувати за допомогою внутрішнього генератора зображень V3.
Наприклад, спроба створити відео на основі зображення з Midjourney, привела до наступного результату.
Загалом, незважаючі на недоліки, V3 fast дійсно вартий уваги. Збираюся продовжувати експерименти.
Кітбашинг та Luma: Трохи Творчості
Повертаючись до експериментів, я вирішила скористатися новою функцією Luma – modify. У попередньому відео я вже розповідала про це. Отже, ось що у нас вийшло для “Твін Пікс”:
Спочатку – ранній тестовий кадр для “Твін Пікс”. Потім – експерименти з Midjourney’s retexture. Потім були використані налаштування функції Luma, set to a very low level. І ось результат.
Загалом, я задоволена.
Висновки: Чи Варто Чекати?
В цілому, я дуже рада, що V3 отримав швидкий режим. На мою думку, він набагато кращий, ніж модель V2 fast, про яку всі скаржилися. Здається, Google нарешті прислухається до наших скарг на ціну і щось робить.
Я, звісно, буду уважно стежити за останніми новинами V3. А поки що дякую за перегляд! З вами була Ліла Гарт.