V3 з прискоренням: Швидко, Економно та (Не Зовсім) Переломлює Правила
Привіт, друзі! З вами Ліла Гарт, і сьогодні скажімо, ми занурюємося у. Світ генеративного відео, де Google щойно випустив прискорений режим для V3. Так, ви правильно почули – “швидкість” і “V3” в одному флаконі! Аби не бути голослівним, я звернулася до самого Йєті, який, власне, і повідомив про це (хоч і з натяком на іронію): “V3 з прискоренням нарешті тут! Це круто, і коштує дешевше. “
Тепер, звісно, виникає питання: чи порушує це. Насправді, правило скажімо, “швидко, дешево та добре, але обираєш два”? Давайте розберемось! Разом ми:
- Порівняємо швидкий режим з “Big Daddy” (як автор називає якісний режим).
- Поговоримо про ціну прискореного режиму (яке, сподіваюся, вас приємно здивує! ).
- Розглянемо цікаву формулу підказок для V3 та. Одну велику хитрість, яку ви точно захочете знати.
Операція “Швидкість”: Чи Варто Воно Вашої Уваги?
Ще до офіційного виходу прискореного режиму, я вирішила поекспериментувати. І, уявіть собі, знаєте що і вийшло досить непогано! Безумовно, але спочатку – трохи передісторії.
Автори відео вирішили створити оду на честь улюбленого серіалу “Твін Пікс”. Ось як виглядає перший результат (а далі буде ще. Цікавіше):
“У цьому місті є свої секрети, агенте. Але такого тут не стається. Я знайшов тіло і воно було загорнуте у пластик. Розумієш, це місто – не таке, як інші місця. Сови не такі, як здаються. І кава. Щоб було ясно, ну, вона теж має секрети тому це чудовий кухоль Джо. Звичайно, ти дивишся не туди, агенте. Тобі треба дивіться, бути в лісі, говорити з совами. Там – хатина бо чорна хатина. Ніколи не заходь туди. Обіцяєш? Ти захочеш це побачити, агенте. “
Так, трохи моторошно, але, на диво, досить атмосферно! Всі ці кліпи були згенеровані в V3 fast, хоча я і скористалася функцією Topaz upscale, аби покращити їх.
Битва Титанів: V3 Quality vs оскільки V3 Fast
А тепер – справжнє випробування. Час для порівняння “лоб у лоб” між якісним режимом (який автор ласкаво називає “Big Daddy”) та прискореним.
Перший раунд: натхненна Fallout сцена.
- V3 Quality (“Big Daddy” mode): досить непогано. Але є слухайте, невеличка заминка з жіночим персонажем. Або слухайте, вона просто спіткнулася об лозу. Також варто зазначити, що я просила діалог, але його не отримала. (Ймовірність отримати діалог у V3, як помітив автор, становить близько 25%. )
- V3 Fast: І тут починаються сюрпризи! (Він, до речі, відрізняється від “Big Daddy” тим, що ми отримали діалог! ) Герої обох версій – як у якісному. Так і скажімо, в прискореному режимах – виглядають досить схоже! Навіть цифрові номери на броні героїв – ідентичні! Чесно кажучи, (Хоча я цього не просила. )
Ось як виглядає прискорений режим:
“Потрібно бути обережними. Тут можуть бути бандити або й гірше проте завжди. Будьте пильні! “
я схиляюся до думки, що швидкий режим -. Звичайно, це той самий звичайний режим, але без одного-двох фінальних етапів обробки.
Ще один приклад: сцена, натхненна Джеймсом Бондом. Чесно кажучи,
- V3 Quality: Виглядає добре, але ми отримуємо субтитри. І втрачаємо жарт.
- V3 Fast: “Маленька приємність для вашого зап’ястя, Бонде, якщо вам потрібно швидко піти. ” Тут ми отримали і жарт, і ідеальні кадри! Цікаво,
якщо оцінювати, я б віддала перевагу швидкісному режиму.
“Гра Престолів” зустрічає V3
І ще один приклад, натхненний тобто, “Іграми Престолів”:
- .
- V3 Quality: Ми бачимо більше текстур, обличчя не такі розмиті, як у швидкому режимі. Але, знову ж таки, в якісному режимі ми отримуємо “обрізаний” кадр. Очевидно,
- V3 Fast: Сцена виглядає більш цілісною.
Ціна Питання: Швидкість Має Свою Вартість
Отже, як. Ви вже, напевно, здогадалися, прискорений режим доступний лише на платформі Flow. Звичайно, я ще не бачила його в API. Але ціна – всього 20 кредитів за генерацію. Це означає, що ви можете отримати до 625 результатів, наприклад, використовуючи V3 fast, на відміну від 125 на місяць у режимі V3 quality. Дивно, це великий стрибок!
Якби не режим fast, у мене б не вийшло створити коротке відео. У стилі розумієте, “Твін Пікс” (якщо рахувати загальну кількість генерацій, то, напевно, на рівні 103). Зважаючи на те, що це було перетворення тексту на відео, я зіткнулася зі стандартними проблемами:
- Послідовність персонажів.
- Труднощі з налаштуванням.
Як завжди, правильного чи неправильного способу підказок не існує.
JSON Магія: Підказки, Створені Для Вас
Але зараз зупинимось детальніше. На цікавому форматі текстових підказок, який називається JSON (JavaScript Object Notation). Справа в тому, що це, по суті, стандартний текстовий формат для представлення структурованих даних. Чесно кажучи,
Особисто, я не думаю, що ви повинні писати це все самі. Відверто кажучи, саме тут вступає в гру LLM.
Як Це Працює?
Що я зробила – це створила інструкції для GPT або Gem, або будь-якої іншої LLM-ки, якою ви користуєтесь. Безумовно, щоб було ясно, ці інструкції дозволять вам бути настільки вільними або конкретними, наскільки ви хочете. Очевидно, ви навіть можете завантажити зображення, і LLM не тільки надасть вам текстову підказку, але й результат у форматі JSON. Експериментуйте, щоб побачити, бачите, що виходить краще оскільки
З цим форматом вийшло досить добре. І знову наприклад, ж таки, я не давала жодних. Подробиць про те, що мала статися у відео. Я просто дала типу, картинку та сказала: “Зроби щось, в такому дусі. “.
Експерименти з Картинками: Як Зробити Зображення Живим
Ще одне цікаве відкриття V3, авторство якого належить Мартіну Небелонгу. Цей трюк працює лише в режимі V3 quality, але він може здивувати. Вам потрібно завантажити зображення персонажа на зеленому екрані. Потім напишіть:
[prompt] instantly jump/cut розумієте, on frame one, two, and then whatever you want.
І, вуаля, ви збережете деталі персонажа! Ось результат.
Разом з V3, при перетворенні зображення на. Відео, ви, зазвичай, не отримуєте звук та діалоги.
Експериментуючи скажімо, з цим, він отримав такий результат (але з кількома недоліками).
Я виявила, що краще генерувати за допомогою внутрішнього генератора зображень V3.
Наприклад, спроба створити відео на основі зображення з Midjourney, привела до наступного результату.
незважаючі на недоліки, V3 fast дійсно вартий уваги. Збираюся продовжувати експерименти.
Кітбашинг та Luma: Трохи бачите, Творчості
Повертаючись до експериментів, я вирішила скористатися новою функцією Luma – modify. У попередньому відео я вже розповідала про це. Цікаво, отже, уявіть собі, ось що у нас вийшло для “Твін. Пікс”:
Спочатку – ранній тестовий кадр для “Твін Пікс”. До речі, потім – експерименти з Midjourney’s retexture. Потім були використані налаштування функції Luma, set to a very low level. Очевидно, і ось результат.
я задоволена оскільки
Висновки: Чи Варто Чекати, щось на зразок.
В цілому, я дуже рада, що V3 отримав швидкий режим. На мою думку, він набагато кращий, ніж модель V2 fast, про яку всі скаржилися. Здається, Google нарешті знаєте, прислухається до наших скарг на ціну і щось робить. Безумовно,
Я, звісно, буду уважно стежити за останніми новинами V3. Фактично, а поки що дякую за перегляд бо з вами була Ліла Гарт.