Sora 2: Уриваємося в майбутнє відео – чи готові ми?

    Мій приятель Петро якось зізнався за кавою: “Лілю, набридли ці коди-запрошення, географічні обмеження та вічне “зачекайте трохи”. Хочеться просто взяти й творити!” І ось, наче почули, з’явилася новина, що, здається, саме для таких, як Петро. Sora 2, той самий штучний інтелект, що генерує відео, тепер доступний, як то кажуть, “в дикій природі”. Тобто, забудьте про запрошення, обмеження за країною та навіть операційні системи. Але, звісно, як це буває з OpenAI, не обійшлося без “але”. І про нього сьогодні поговоримо.

    Розберемося, де найкраще використовувати Sora 2, і відповідь може вас здивувати. Також розглянемо шалені лайфхаки та поради, які мені вдалося відшукати. Це те, що вам точно стане в пригоді.

    Dev Day: коли ефір вирує, а новини народжуються

    Нещодавно OpenAI провели свій щорічний Dev Day. Більшість обговорень, звичайно, крутилася навколо нового конструктора агентів – і, чесно кажучи, штука справді вражає. Але ближче до кінця презентації, за всім цим дійством, з’явилася важлива новина. Sora 2 відтепер доступна через API.

    Що це означає? Все одно, що відчинені двері для всіх. Якщо ви стикалися з регіональними обмеженнями або так і не дочекалися заповітного запрошення, нині – ваш шанс. І ще одна чудова новина: більше жодних водяних знаків! Зовсім! Можете собі уявити? Чисте відео. Це справжнє свято для тих, хто планує використовувати згенеровані ролики у своїх проєктах.

    Але, звісно, без “але” нікуди

    І ось ми підходимо до того самого “але”. З’ясувалося, що версія Pro через API генерує відео тривалістю 12 секунд. Це не критика Higsfield чи Krea – радше, закономірність. Я не мала часу перевіряти кожен API, але, підозрюю, так відбувається скрізь.

    Хороша новина в тому, що через API ви можете генерувати відео у форматі 1080p. Це стосується і Krea, і Higsfield. Тоді як на “рідній” платформі Sora, навіть у стандартній якості, ви отримуєте 10 секунд. А ось у високій роздільній здатності – до 15 секунд. Тому не зовсім зрозуміло, звідки взялися ці 12 секунд.

    Демонстрація: коли зомбі стають добрими хлопцями

    Щоб показати різницю, уявімо собі трейлер до фільму, де зомбі – хороші хлопці, розумні, а люди – погані, тупі.

    (Демонстрація трейлера в стандартному режимі)

    “Вони все ще там. Ми продовжуємо вчитися. Так ми залишаємося вільними. Люди повільні, гучні, полюють за мізками. Думаєте, ви розумніші за нас? Статистично, так. Цієї осені.”

    (Демонстрація трейлера в режимі Pro)

    “Восени. Мертві просто хочуть жити! Вони наближаються. Чому вони такі повільні? Вони живі! Факели повернулися… Трупи. Ми не трупи. Ми люди. Типу.”

    Дві миттєві ремарки: по-перше, я б із задоволенням подивилася цей фільм. По-друге, ви звернули увагу на водяні знаки? Ці ролики я згенерувала на платформі Sora, як у версії Pro, так і в стандартній. На API ж усе це тривало доволі повільно, як буває одразу після запуску. Переконана, десь у Пало-Альто зараз процесори просто плавляться.

    Тож, маємо наступне: на платформі Sora, якщо у вас платний акаунт Pro за $200, ви все одно отримуєте водяні знаки. Якщо використовуєте API – знаків немає, але втрачаєте 3 секунди. Досить дивне рішення, погодьтеся. Сподіваюся, згодом водяні знаки приберуть і з платної версії на сайті.

    Якість – чи головне?

    Щодо якості, то, чесно кажучи, особливої різниці між платформою Sora та API я не помітила. Ось, наприклад, мій улюблений запит: “Створи мені 15-секундну моторошну історію з несподіваним поворотом”.

    • На Sora: “Хто ти? Це я. Ти зайняв моє місце.”
    • Через API (з модифікацією на 12 секунд): “Ти хочеш померти тут?”

    Загалом, з точки зору якості зображення, вони практично однакові. Так, через API ми втрачаємо ті 3 секунди, де, ймовірно, був той самий поворот – жінка насправді привид. Sora обожнює такі твісти. На платформі ж він є, але з водяними знаками.

    Cameos? Ні, через API поки що ні

    Ще одна функція, яка недоступна через API – це “Cameos”. Мій друг Мартін, який часто з’являється на нашому каналі, продемонстрував це, використовуючи мій образ:

    “Вимкни світло, друже!”

    Мартін використав API через Freepic для цієї генерації. Мушу визнати, у нього ця “п’ятиденна” виглядає набагато крутіше, ніж у мене. І навряд чи хтось сприйняв би цю фразу серйозно від мене. Хіба що Alexa.

    API також відображає обмеження Sora щодо фотографій – ви не можете створювати відео з реалістичними зображеннями людей. Але для анімації, як ми вже обговорювали в моєму попередньому відео про Sora, ця функція чудова.

    “Що сталося зі світом? Не знаю. Але хто б це не зробив, він все ще десь там.”

    Я б сказала, це ідеальний варіант для анімаційних проєктів, де ви використовуєте одну картинку. Можна витиснути максимум користі.

    А щодо “Cameos” – я повністю згодна, що їх не повинно бути в API. Без водяних знаків і з “Cameos” – це був би справжній хаос. До речі, про це. Чи бачили ви мій короткометражний фільм “Cameo”, який я випустила вчора? YouTube, як це часто буває, трохи його “приховав”, але посилання буде в описі [посилання на короткий фільм]. З цікавості, як швидко ростуть такі проєкти: я витратила близько 60 генерацій, враховуючи й ті, де все пішло шкереберть.

    “Я не існую. Ти мене створив. Тебе ніщо не зупиняє, щоб зробити все це, якщо ти хочеш.”

    Так, були моменти, коли все йшло не за планом, і доводилося змінювати напрямок. Але загалом, з 60 генерацій вийшло 18 кадрів для фінального фільму. Тобто, співвідношення приблизно 30%. Для кількох “вставних” кадрів, зокрема зі супермоделями, я використала Nano Banana та VO3. Тому, як то кажуть, ніколи не залежайте від одного інструменту.

    Трюки, від яких голова йде обертом

    А тепер про найцікавіше – хитрощі та можливості Sora 2.

    1. Сторіборди – оживлення малюнків!

    У минулій статті я показувала, як можна створювати відео Sora за допомогою сторібордів [посилання на попередню статтю]. Це й досі звучить майже як магія. Продовжуючи експериментувати, я спробувала дати їй сторіборди з аніме. Не знаю, з якого саме, але це класика від Madhouse Studios.

    (Приклад аніме-сторіборду, що перетворюється на відео)

    “Мій японський не ідеальний, тож якщо хтось захоче перекласти – буду вдячна. Але, погодьтеся, голоси вийшли просто неймовірні, чи не так?”

    Ось ще один приклад, цього разу з кінематографічним ухилом:

    “Ви двоє схожі на неприємності. Це мій улюблений тип компанії. Тільки карти та розмови, чоловіче. Ліфт готовий. Найвищий поверх. Ведіть, хлопці.”

    Хм, чи не вийшло трохи… пікантно? Ну, принаймні, я щиро вірю, що той хлопець просто йшов на зустріч, де гратимуть у карти.

    2. Сценарні сторінки – нова реальність?

    Але ось тут стає по-справжньому гаряче. На вихідних мені порадили ідею: можна завантажувати сторінки сценарію, і Sora робитиме майже те саме. Ось приклад:

    Сценарій: “Морський маєток. Інтер’єр, консерваторія. Стиль “Даунтонське абатство”.”

    Зображення-запит: “Ви виглядаєте як чоловік, що сумує. Я виглядаю як чоловік у формальному одязі. Те саме.”

    Звісно, якщо перезавантажити, персонажі змінюватимуться, а репліки іноді плутатимуться. Але загалом, це працює! Я тут із другом (і ChatGPT) нашвидкоруч підготувала невеличкий уривок:

    Сценарій: “Ти перевірив. Все там. Кожна відомість, кожен банківський переказ, як ти й казав. Я зробив свою частину. Паспорт для передачі. Така була домовленість. Домовленість. Мені потрібне ще одне ім’я. Технолог, що зашифрував примарні рахунки. Це…?”

    (Відео, згенероване зі сценарію)

    Як бачите, Sora не змогла вставити весь сценарій. За моїми підрахунками, за 15 секунд вона може обробити приблизно 80 слів діалогу. Але це лише груба оцінка, звісно.

    3. “Вгадай, хто це?” – хак для сталих персонажів

    І наостанок – ще один цікавий трюк, який мені показав мій друг Бренд. Ми знаємо, що в режимі “зображення в відео” не можна створювати реалістичних людей. Але! Якщо ви завантажите ескіз, а потім попросите перетворити його на “кінематографічне зображення” або “реальну людину”… ви отримаєте ось це.

    (Демонстрація ескізу, що перетворюється на зображення персонажа)

    Це справді дивовижно. Я сама пробувала цей хак: іноді працює, іноді – ні. Здається, все залежить від того, наскільки “ескізним” вийде ваш початковий малюнок.

    Наприклад, ця дівчина з вогнеметом. Я спробувала зробити з неї ескіз… і це не спрацювало.

    Чи “нерфнули” Sora 2?

    Чи сталося таке, що Sora 2 “послабили”? Відверто кажучи, я думаю, так. Особливо помітно це на матеріалах, що захищені авторським правом. Ну, і я досі вважаю, що найменш цікаве застосування цієї технології – це створення мемів із Губкою Бобом чи Пікачу.

    Однак, мушу визнати, що фізика та загальна якість зображень останнім часом трішки погіршилися. Ось, наприклад, сцена бійки, яку я згенерувала кілька днів тому:

    (Відео бійки, згенероване раніше)

    Хоч і не ідеально, але це досить вражаюче, чи не так? Якби ви спробували згенерувати кілька таких версій, можна було б зібрати щось на кшталт тих старих бойовиків з ближніми кадрами, як у Джейсона Борна.

    Але ось та сама сцена, згенерована сьогодні:

    (Відео тієї ж сцени, згенероване зараз)

    Так, висновок простий: найімовірніше, обчислювальні потужності обмежили. Sora 2 стала справжнім хітом, і тепер з API її використовує ще більше людей. Тому має сенс, що OpenAI намагаються покрити витрати, випускаючи API.

    Гаманець плаче: скільки це коштує?

    І тут ми підходимо до цін. Ціноутворення Sora через API таке:

    • Портретний режим (720p): $0.10 за секунду.
    • Пейзажний режим: $0.30 за секунду.
    • Sora 2 Pro (1080p): $0.50 за секунду.

    Я не можу відстежити всі платформи, адже вони використовують божевільно різні системи кредитів, але це приблизно ті ціни, на які варто орієнтуватися. Особисто я, мабуть, зупинилася б на $0.30 за секунду, а потім масштабувала б у зовнішніх програмах, на кшталт Topaz [посилання на Topaz]. Але, звісно, кожен сам собі господар.

    А от план ChatGPT Pro, який дає доступ до Sora 2 Pro, коштує $200 на місяць. І, що цікаво, зараз кількість генерацій відео в день обмежена 30. Звучить не так вже й добре, але якщо порахувати…

    Гіпотетично, якщо ви максимізуєте 30 генерацій на день (пам’ятайте, що ці платформи теж хочуть заробляти), то за допомогою API ви б витрачали від $450 до $9000 на місяць! Раптом $200 виглядають не такими вже й страшними, правда?

    Висновок: що обрати?

    Отже, підсумуємо. Водяні знаки на Sora – це, звісно, мінус для професійного використання. Тож, враховуючи обмеження на зображення в відео, “криву” фізику та водяні знаки, я б нині радила погратися з API.

    Якщо ж вам не критичні водяні знаки, і ви більше орієнтуєтеся на соціальні мережі та меми – Sora зараз вибухає в Instagram [посилання на приклад використання Sora в Instagram], то чому б і ні?

    Є багато чуток, і я припускаю, що скоро з’явиться більш професійна версія Sora 2 зі сторібордами. Вона, найімовірніше, буде дорожчою. Але якщо ви хочете використовувати її як професійний інструмент, то, гадаю, це вже на шляху.

    Це схоже на типовий реліз від OpenAI: потяг уже рушив, а рейки ще тільки кладуть. Але я вірю, що з часом все стане на свої місця.

    А поки що Google поводиться незвично тихо [посилання на новини про Google], що зазвичай означає, що вони щось готують. А якщо не вони, то хтось із 500 інших. Отож, до нової зустрічі! І дякую, що були зі мною.


    Підсумовуючи все вищесказане: Sora 2 стала доступнішою, але вибір між платформою та API залежить від ваших потреб. API пропонує чисте відео без водяних знаків, але з певними обмеженнями за тривалістю. Платформа Pro має свої переваги, але з водяними знаками. Якість зображення наразі схожа. Ціни можуть варіюватися, але зовнішнє масштабування може допомогти зекономити.

    У результаті: експериментувати з API – чудова ідея, особливо для професійного використання. Але слідкуйте за оновленнями, адже OpenAI не стоїть на місці.

    Що далі? Спробуйте самі! Пограйтеся з API, створіть щось несподіване. А якщо хочете більше таких історій і порад – підписуйтеся на канал і ставте лайк! І обов’язково пишіть у коментарях, що ви хочете, щоб ми протестували наступним. До нових зустрічей у цифровому світі!

    Поділитися.
    0 0 голоси
    Рейтинг статті
    Підписатися
    Сповістити про
    guest
    0 Коментарі
    Найстаріші
    Найновіше Найбільше голосів
    Зворотній зв'язок в режимі реального часу
    Переглянути всі коментарі
    0
    Буду рада вашим думкам, прокоментуйте.x