V3: Нова Ера Відео, Чи Варта Вона Вашої Уваги?
Відеогенерація з використанням штучного інтелекту стрімко еволюціонує, і Google з новими платформами закинула чергову валізу у цей динамічний простір. Як людина, що захоплюється дослідженням технологій з людським обличчям, я не змогла обійти стороною новітню розробку – V3. Чи справді це початок нової ери, і чи варта ця революція вашого часу та грошей? Пориньмо разом у цей захоплюючий світ.
З виходом V3, Google відкриває двері до Flow – платформі, що об’єднує зображення, аудіо та відео в єдине ціле. Але, як часто буває з передовими технологіями, все має свою ціну. В даному випадку, мова йде про 250 доларів на місяць. Що ж, я, Ліла Гарт, не з тих, хто відмовляється від викликів. Я вирішила заплатити цю суму, щоб подивитися, що ховається за кулісами.
Перше враження: Голос ШІ і експерименти з реальністю
Те, що V3 вміє розмовляти, – це вже революція. Якась частина мене щиро раділа можливості почути голос ШІ, який озвучує створене відео. Тож, щоб отримати більш-менш живе уявлення, я поринула у світ інтерв’ю з випадковими перехожими на вулиці, де задавала прості питання про те, як люди ставляться до відео-шІ.
Мені було цікаво почути різноманітні думки. Від захоплення потенціалом до тривог щодо наслідків. Один з опитаних зазначив, що “потенціал генерації відео за допомогою ШІ просто неймовірний, але це також змушує хвилюватися”. Інші ж вважали, що це “щось, до чого треба звикати”, або що технологія “розширить можливості митців, але це водночас слизький шлях”. Звісно, як з будь-якими новими технологіями, відчуття були різні.
Але найцікавіше попереду. Щоб зрозуміти, що може запропонувати V3, я вирішила почати з експериментів.
Почнімо з “відео ні про що”, яке нібито було натхненне ситкомами 90-х. Результат? V3 дивовижно влучно передає атмосферу того часу. Аспект 4:3, декорації, одяг – все це нагадує про естетику тих років. Недоліком були, звичайно, автоматично згенеровані субтитри, що виглядало трохи недолуго. Але, як виявилося, з цим можна впоратись.
Далі я перейшла до роботи з різними завданнями, що надсилали користувачі. Передусім – з генерацією з тексту.
Далі було дивовижно. Приклади різноманітні й цікаві. У висновку, я зрозуміла, що найсильніше V3 проявляє себе саме в створенні відео з тексту. Також виявилося, що чим детальніше та конкретніше текст, тим кращий результат.
V2 проти V3: Яка різниця?
Звісно, постало логічне питання: наскільки велика різниця між другою і третьою версіями? Щоб відповісти на нього, я порівняла кілька коротких відео у стилі наукової фантастики.
У цілому, я побачила покращення якості, зокрема, зменшення артефактів на зображеннях у V3. Але скажу відверто: різниця не колосальна.
Там, де V3 розкривається у всій красі – це у створенні відео з тексту. Звичайно, не всім подобається ретельно контролювати кожен кадр, але результати, які я отримала, використовуючи детальні текстові запити, були значно кращими. Гарний приклад – сцена в стилі “Славних хлопців” та “Клан Сопрано”. Результат був вражаючим.
Але, найбільша відмінність, що виявилась – це наявність діалогів виключно у відео, згенерованих з тексту.
Переваги, які варто побачити
Ще одним відкриттям було те, що можна було просто вказати тему, навіть не прописуючи діалоги. Пам’ятаєте інтерв’ю з людьми на вулиці? Так ось, V3 без проблем згенеровало відео на тему штучного інтелекту, додавши відповідні репліки.
Він також може писати музику, що, на мою думку, надзвичайно круто.
Особливі недоліки, які варто врахувати
V3 – це не ідеал.
По-перше, все ще є недоліки. Наприклад, недосконалі сцени боротьби. Хоча, звичайно, є позитивні моменти: персонажі не зливаються, ніхто не літає і не вибухає.
По-друге, V3 любить вигадувати діалоги. Це може бути смішно, але не завжди доречно.
По-третє, на даний момент багато функцій, анонсованих на Google IO, відсутні у V03. Наприклад, немає розширенного функціоналу малювання; генерація лише з використанням зображень, створених самим ШІ; відсутня розширена функція відео.
Все це нагадує, що ми, насправді, чекаємо на дуже багато функцій, які будуть відкриті з часом.
Про ціну і висновки
А тепер про найболючіше – про ціну. Доступ до платформи Flow з використанням V3 обійдеться вам у 250 доларів на місяць. Звісно, є стартова ціна – 124 долари на наступні три місяці. На мою думку, це пов’язано з тим, що навіть розробники розуміють, що платформа ще не повністю допрацьована.
За цю підписку ви отримуєте 12 500 кредитів, а один вихід V3 коштує 150 кредитів. Тобто, ви можете створити до 83 відео.
Хочу порадити, – якщо ви вирішите спробувати V3, встановіть налаштування виходу – 1. Не витрачайте кредити на декілька генерацій, це невигідно.
Підсумовуючи, хочу сказати, що текстовий відеовивід все ще вражає, але без збільшення ліміту та доступності більшості функцій, я не можу рекомендувати платформу більшості людей за таку ціну.
Я не буду радити, як вам витрачати гроші. Але, чесно кажучи, я витрачала гроші й на дурніші речі. Також ви отримуєте ранній доступ до Project Mariner та YouTube Premium.
Але якщо ваша основна мета – генерація відео ШІ, тоді, як то кажуть у народі, “ціна кусається”.
Я порадила б розробникам використовувати таку ж систему, як це зробила OpenAI з виходом Sora: кредити, і система переходу в повільний режим після їх вичерпання. Чи почують мене – не знаю.
У будь-якому випадку, наразі V3 – це лише початок низки покращень, які ми побачимо найближчим часом. Розглядайте це як превью того, що чекає ШІ-відео в найближчі 3-5 місяців.
Дякую за увагу!