Ідеальне Гумористичне Фото: Як Чотири “Я” Створили Ідеальну Ліпсинкову Сцену
Цікава подія трапилася минулого тижня. Мій друг, завзятий дизайнер, з яким ми часто п’ємо каву, показав мені дещо таке, що змусило серйозно замислитись. Він сказав: “Ліло, уяви, що можна мати не одну, а цілих чотири версії себе в одному кадрі, які ідеально, ну, майже ідеально співають під твій голос!”
Щиро кажучи, спочатку я подумала, що він жартує або ж випробовує на мені якусь нову експериментальну каву. Але коли він показав результат, я втратила дар мови. Уявіть: чотири мене, чотири різні міміки, чотири окремі голоси, синхронізовані з аудіо, і все це в одній сцені. Це виглядало не як звичайне відео, а як… магія. Або принаймні, як дуже просунутий мультивіковий серіал, де головний герой це я.
Сьогодні ми зануримося у світ, де штучний інтелект стає помічником у творчості. І мова піде не просто про черговий інструмент для створення картинок. Ні, ми говоримо про платформу, створену спеціально для дизайнерів, креативників, для тих, хто любить експериментувати з технологіями, щоб зробити творчий процес менш болісним і більше схожим на задоволення.
Якщо ви бачили моє минуле відео, можливо, пам’ятаєте, як ми досліджували інструмент тієї ж платформи для створення зображень з послідовними персонажами [посилання на попереднє відео]. Тобто, ви могли намалювати одного персонажа, а потім генерувати безліч його зображень, де він завжди виглядав однаково. Сьогодні ж ми поговоримо про один з їхніх нових, скажімо так, “магічних” інструментів. Вони випустили цілу низку нових функцій та оновлень, і вражає, як швидко платформа еволюціонує.
Ми не будемо охоплювати все, бо це зайняло б цілий день, а то й тиждень. Натомість, сконцентруємося на одному, максимум двох інструментах, які мене вразили. Головний герой сьогоднішньої “вистави” – це їхній повністю перероблений інструмент для ліпсинху, який дозволяє синхронізувати до чотирьох персонажів в одній сцені. Так-так, не один, не два, не три, а ЧОТИРИ обличчя, що говорять, в одному кадрі, ідеально синхронізовані з вашим аудіо. Або… чи справді ідеально? Тут ви самі будете суддею. Але перш ніж ми зануримось у цю дивовижну ліпсинкову магію, давайте швиденько скористаємося однією з нових функцій – інструментом для миттєвого створення сторібордів, щоб отримати базове зображення, яке стане основою нашої сцени.
Розділ 1: Створюємо “Ідеальне” Село для Нашої Історії
Отже, почнемо. Відкриваємо вкладку “Сюжетні дошки” (Storyboards). Перед нами простий інтерфейс. Перше, що варто зрозуміти про цей інструмент: він не призначений для автоматичного створення повноцінної послідовності кадрів зі сценарію. Поки що. Він побудований навколо генерації кожного окремого кадру чи сцени. Думайте про це як про надійний генератор зображень, тільки з “родзинкою”.
Що робить його особливим? Це його система тегування та посилань. Ви можете посилатися на вже існуючі зображення, ескізи чи концепції, тегуючи об’єкти або елементи: персонажів, реквізит, фони, пози. Таким чином, система запам’ятовує це і зберігає візуальну послідовність, коли ви створюєте наступний кадр.
Для нашого прикладу я спочатку додам зображення себе як “зображення 1”. А для 2, 3 і 4 я також підготувалася, але з дещо різними виразами обличчя. Для обстановки давайте оберемо щось таке, що запам’ятається. Як щодо лісу, натхненного “Відьмаком”? Хоча, ні. Це не “весело”, це просто… страшно. Але неймовірно красиво! Атмосферно, кінематографічно, це надасть нашій сцені більшої “живості”. Ех, якби ще Генрі Кавілла туди повернути… Ну, це вже мрії.
При створенні запиту (промпту) важливо посилатися на всі завантажені зображення: ваші базові персонажі, натхнення для фону, будь-які ескізи чи пози. Немає потреби писати “есе”. Чіткий, короткий опис зазвичай працює чудово.
І ось, коли ми натискаємо “Згенерувати”, Design починає працювати. Швидкість досить прийнятна. Якість теж непогана. І після кількох секунд ми отримуємо зображення. Чесно кажучи, я ним задоволена. Усі розташовані непогано, загальна атмосфера відповідає тому, що я мала на увазі. Якби мені знадобилося щось доопрацювати, я б перейшла до редактора зображень на основі чату, але зараз ми зосередимося на нашому головному завданні.
Розділ 2: Зустрічайте Чотири “Я”: Магія Ліпсинху
Тепер, коли наша сцена готова, переходимо до ліпсинху! Заходимо у вкладку “Ліпсинх” (Lip Sync). Нас вітає перший крок. Перше, що потрібно зробити – завантажити наше базове зображення, тобто те, яке ми щойно створили. Система автоматично визначає всі обличчя на зображенні, і робить це напрочуд добре. Якщо якесь обличчя було пропущено, не проблема! Ви можете вручну позначити обличчя, що дає ще більше контролю.
Ви помітите: п’ять шарів. Один для базового зображення зверху, і чотири нижче, що представляють кожного мовця у сцені. Кожен з цих шарів може мати власний аудіо-трек. Це означає, що ви можете мати чотири повністю окремі голоси, що говорять різні речі, перекриваються, реагують… ну, ви зрозуміли. Чотири людини.
Отже, натискаємо на “Мовець А”, який буде оригінальним “мемом”. Тут ми маємо дві основні опції. Ми можемо завантажити власне аудіо – попередньо записану голосову доріжку чи кліп. Або ж можемо скористатися системою перетворення тексту на мову (Text-to-Speech). Для перших трьох персонажів я завантажу власні MP3-файли, а для останнього напишу коротку, дурненьку фразу, щоб зробити нашу розмову трохи кумеднішою.
Після того, як текст написаний, я можу вибрати з переліку голосів та мов. Це чудово для тих, хто не говорить англійською, або для проєктів, де потрібні міжнародні голоси. Ви можете попередньо прослухати кожен голос перед остаточним затвердженням. І, чесно кажучи, це просто весело – тестувати, як ваш сценарій звучить різними тонами: від спокійного та професійного до гіперактивного ведучого YouTube.
Після того, як усі голосові доріжки додані, ми можемо перетягувати їх на таймлайні, щоб налаштувати їхню тривалість. Можна зробити так, щоб вони трохи перекривалися для природнішого діалогу, або залишити паузи для комедійного ефекту. Ви також можете обрізати, вирізати або переставляти фрази лише кількома кліками. Все виглядає досить інтуїтивним.
Розділ 3: “Так, але Чи Це Справді Працює?” – Де Генерація Стає Мистецтвом
Настав час для етапу генерації. І тут у нас є два варіанти: “Звичайний режим” (Normal Mode) та “Професійний режим” (Pro Mode). Звичайний режим швидший, дешевший, чудово підходить для тестування ідей чи чернеток. Професійний режим коштує трохи більше і потребує більше часу на рендеринг, але різниця в реалізмі… Ну, один – це “добре”, а інший – “погано”. Отож, вирушаємо, натискаємо “Згенерувати” в професійному режимі. І, залежно від тривалості аудіо та кількості персонажів, це може зайняти кілька хвилин.
У моєму випадку генерація тривала близько 10 хвилин, що непогано, враховуючи, що це чотири людини. І ось він, результат. Давайте витратимо хвилинку, щоб просто подивитися на це.
“Чи це ми всі – Себ?”
“Так, я певна, що я вибрала бути серйозною.”
“Запізно. Я вже серйозна.”
І я доволі задоволена. Якість залишається досить сталою протягом усього процесу. А справді вражає те, наскільки простим здається весь цей процес.
Розділ 4: Це Не Лише Для Мемів: Безмежні Можливості
Design бере те, що зазвичай вимагає професійних навичок анімації, і робить це доступним для будь-кого, хто має ідею та кілька аудіо-кліпів. Це стосується всіх нових інструментів зі штучним інтелектом. Це просто, або принаймні, більша частина цього – просто. Іноді ж… ну, як коли.
Тож, що ви могли б зробити з цим? Я маю на увазі, це не тільки для YouTube-блогерів чи творців мемів. Ви можете використовувати це для освітніх відео, маркетингу, тренінгів, анімованих подкастів, віртуальних історій, озвучення коміксів, навіть для прототипування сцен для анімаційних фільмів перед повноцінним продакшеном.
І Design має багато інших інструментів. Якщо поєднати їх з іншими функціями, такими як послідовність персонажів, пози, сторібординг, ви можете побудувати власну міні-анімаційну серію повністю в межах цієї однієї екосистеми.
Розділ 5: Чи Це Кінець Світу Технологій?
Цікаво знати: Чи означає це, що це універсальний інструмент, який вирішує все? Ні. Існує багато подібних інструментів. Цей досить пристойний. Я, звісно, люблю свій комфорт, але іноді… і деякі люди… їм просто потрібна зручність. Вони готові платити за неї, і тоді такі інструменти – чудовий варіант.
Отже, що я думаю в цілому? Чесно кажучи, це дуже добре. Design видається однією з тих платформ, яка постійно розвивається. Особливо інструмент ліпсинху відчувається як солідний стрибок вперед як у зручності використання, так і в реалізмі. Він вже дає багато задоволення від гри з ним, і він досить потужний для творців контенту.
А ви як думаєте? Ви б використовували інструмент ліпсинху від Design у своїх проєктах? Який ваш улюблений інструмент для ліпсинху? Чи є інший, який, на вашу думку, кращий? Дайте мені знати в коментарях нижче. Якщо у вас є інші коментарі – також кидайте їх униз. Мені справді подобається читати коментарі та ідеї, а також бачити, як ви їх використовуєте.
Але будь ласка, будьте доброзичливими один до одного. Спільнота ШІ – це таке дружнє місце. Давайте зберігати це.
Гаразд, на сьогодні це все. Побачимося в наступному відео! Бувайте!







