Повернення Мініакса: Чи стане 2.0 вбивцею AI-відео? – Огляд зсередини
Тихіше, друзі, тихіше! Сцена AI-відео знову оживає, і цього разу – з гучним поверненням: Miniax випустив довгоочікуване оновлення 2.0. І знаєте що? Виглядає багатообіцяюче.
Мене звати Ліла Гарт, і я, як завжди, готова зануритись у глибини нового, щоб з’ясувати, що ж цей звір може запропонувати. Чи стане це оновлення тим самим “убивцею V3”, на якого дехто так сподівався? Ну, побачимо. Але вже зараз можна сказати, що це дуже серйозна модель, на яку варто звернути увагу.
Тож, запасіться кавою, влаштовуйтесь зручніше, і давайте разом заглянемо за лаштунки Miniax 2.0. Ми протестуємо його здібності, подивимося на дивовижні роботи спільноти, поговоримо про те, що чекає на нас в майбутньому, і, що найголовніше, розберемося з ціною. Впевнена, ви будете раді почути новини.
Довга перерва та нові обрії
Довго Мініакс мовчав, довго… Останнє велике оновлення платформи, принаймні, якщо говорити про відео, було ще в листопаді минулого року, коли світ побачив Director Mode. Але це зовсім не означає, що команда бездіяла. Ми отримали оновлену аудіомодель, а ще нещодавно відсвяткували 5 днів Hilu Miniax, представивши Miniax M1 LLM з інпутом в 1 мільйон токенів та аутпутом в 80 тисяч токенів – і все це з відкритим кодом!
Але, погодьтесь, найбільше нас цікавило питання: що ж з відео? І ось, наприкінці минулого тижня загадкова нова програма для генерації AI-відео під назвою Kangaroo опинилася на вершині лідерів. Не знадобилося багато часу, щоб спільнота розгадала цю головоломку: це і є модель Miniax 2.0! І удача посміхнулась нам, адже довго чекати не довелось.
Перші враження: швидко та функціонально
З першого погляду: нова модель генерує відео тривалістю 6 або 10 секунд з роздільною здатністю 768, а також 6-секундні відео в 1080p. Модель підтримує генерацію відео з тексту та з зображення. Не вистачає деяких хитромудрих функцій, але це ж тільки початок! Ефекти, пресети та звук додадуть пізніше. Хоча, враховуючи, що все ґрунтується на текстових підказках, Director Mode, схоже, таки працює, і ми подивимось на це трохи пізніше.
Щодо відсутності нативної аудіогенерації, знаю, декого це засмутило, але розробники вже заявили, що незабаром з’явиться lip-sync, тобто синхронізація губ. Не зовсім те, що робить V3, але все ж. І хоча я велика шанувальниця V3, але не ціни.
Перевірка реальністю
А тепер давайте перейдемо безпосередньо до тестів. Щоб зрозуміти, на що здатний новий Miniax, я провела серію експериментів.
Чоловік у синьому костюмі та вовк: Казино та великі ставки
Почнемо з нашого старого знайомого в синьому діловому костюмі. Востаннє ми бачили його в пустелі, де він намагався спіймати попутку, але ніхто не зупинявся, бо з ним був вовк. Виявилось, що наш герой просто опинився біля Лас-Вегаса і тепер заграє в казино.
Дивовижно! Модель генерує на 768, аби витягти всі 10 секунд. Акторська гра, як на мене, на висоті – і головний герой, і вовк грають просто чудово! Звісно, можна помітити ефекти смугастості та морфінгу на барабанах грального автомата, але це вже причіпки. Загалом, робота дуже вражаюча. Рухи та колір – все виглядає як треба.
Агенти, помста та шкіра: Кинути виклик уяві
Я також хотіла перевірити, як модель впорається з створенням чогось нового. Взяла зображення жінки-вбивці у вирішальний момент – вона вирішує помститися! – і попросила: “Жінка встає, камера рухається праворуч, з’являється ще один суперагент у чорному шкіряному тактичному костюмі”.
І ось – результат! Виглядає дуже добре. Наш герой стилістично відповідає загальній сцені. Спроба з тим же промтом, дала подібний результат! Модель дійсно вміє адаптуватись, це дуже вражає, особливо враховуючи, що стилістика першого кадру збереглась й у другому.
Культ, вогонь та демони: Створення нового без посилань
Ще один експеримент: група культистів викликає вогняного демона. Звичайний собі вечір п’ятниці, що тут скажеш? Промпт: “Піднімають руки, земля тремтить, червоний туман кружляє, з’являється вогняний демон”. Результат – відмінний. Ми ще поговоримо про переміщення камери, але варто відзначити ось що: в цих 10-секундних роликах реалізовано простий наїзд. Десь на 4-5 секунді з’являється розмиття. Є думка, що є якийсь перехід, який може ламатись при довгих роликах. Що, втім, не завжди трапляється. Ще одне повторення дав точний перфектний результат. Буває!
Текст у дії: Ефектні динамічні сцени
Перейдемо від зображення до тексту. Текст-у-відео в новому Miniax, на мою думку, дуже хороший. Наприклад, 10-секундна сцена стрілянини в стилі Джеймса Бонда. Тут є за що зачепитися! Динаміка руху персонажів, камери… Так, може, занадто ефектно, але, зрештою, це текст-у-відео!
З таким же промптом використали зображення як вхідне. Вийшло “забагато”. У Бонда повністю-автоматичний пістолет, але все одно є на що подивитись.
Нове проти старого: Порівняльний аналіз
Ось, наприклад, зображення, яке ми використовували, коли тільки з’явився Director Mode. Ідея проста: жінка встає та йде геть. Стара модель створювала дивні фізичні ефекти, і найвдалішою версією було, як героїня встає і йде від одного бару до іншого. Нова версія впоралася з цим завданням набагато краще. Вона й справді встає, повертається і йде. Вона також робить цікавий ефект: десь через 5-6 секунд починає м’яко розмивати зображення. Досить розумний хід! Загалом, відмінний результат. І, так, ви можете використовувати Director Mode, тобто, працювати з текстом. Просто клікаєте на нього, і маєте у своєму розпорядженні кілька налаштувань камери.
У цьому випадку ми додали рух камери, панораму та відстеження. Вийшло дуже сюрреалістично. Ми чітко бачимо трекінг і панораму. Чудовий кадр! Перевіряємо узгодженість та уяву. Це був перший кадр, який я запустила в Director Mode. Стара модель. Промпт “панорама ліворуч”. Ми отримали непогану картинку.
Нова модель дає набагато більше динаміки з тим, що рухається. Камера все ще панорамить ліворуч, але замість гігантського футуристичного міста (його не було в промпті!). Очевидно, нова модель зробила значні покращення.
Бій без правил: Експерименти з рухом
Рукопашний бій – завжди хороший тест. Ось сцена кунг-фу. Ще не ідеально, але, в цілому, сподобалось. М’якість в зображенні. Невеликий морфінг у білому одязі. Але в цілому, що стосується хореографії та руху камери… Я думаю, що виглядає відмінно, особливо кінцівка!
Текст-у-відео з тим же промптом дає результат, який має ті ж проблеми, але я вражена тим, як камера вирішує завершити крупним планом! Показує трохи драматургії і трохи сюжету.
Спадщина кінематографа: Відтворення чужої слави
Кадр із фільму Орсона Веллса “Дотик зла” – один з найвідоміших в історії кіно. Тож, пробуємо відтворити його. Стара модель… що ж, не спрацювало. Нова модель все ж таки дає рух з рук, і рух камери вгору. Це не ідеальне відродження… але сцена з “Дотику зла” надзвичайно складна. Це найближчий результат, який ми бачили.
Різноманітне: Від Кайдзю до анімації
Кілька додаткових прикладів, перш ніж ми перейдемо до робіт спільноти:
- Кайдзю проти робота в місті.
- Дослідницьке відео з панорамуванням.
- Збереження стилю персонажа в стилі гібридної анімації.
Все виглядає чудово!
Голос спільноти: Дивовижні роботи
А тепер давайте подивимось, що ж зробила спільнота.
- Tom likes robots: Вогнедишний дракон. Вражаючий! Фізика вогню на висоті.
- Dream frame: Не знаю, чи це продовження, але дракон таки підпалив – схоже, що лякало!
- Whoosha Rocks: Перспектива від першої особи: вторгнення інопланетян.
- Ola Renick: Чудовий водійський кадр з панорамуванням.
- BD Rocks: Натхненний 80-ми фентезі-кадр. Модель також навчилась правильно писати!
- Pinto Creation: Три кадри, які будуть об’єднані в короткометражку.
- Loop and Mix: Емоції: сум! Виглядає природно. Наступний – її чоловік-каскадер.
- Loop and Mix: Вихід у високій моді. Чудово!
- AV: 360. Ми бачили різні версії, де героїня повною мірою демонструвала ефекти.
- Brent Lynch: Кадр з фільму про супергероїв. Особливо сподобалась посмішка в кінці!
- Stevie Mack: 10 чудових секунд з орком! Спостерігати можна безкінечно.
Загалом, дуже добре, враховуючи, коли це було відзнято.
Підсумок: На порозі нового
Підсумовуючи, мушу сказати, що перший день виглядає дуже перспективно. Приємно, що Miniax повернувся.
Ціна питання
Щодо вартості: видається, що на момент запуску діє знижка. 33% на місяць, 40% на квартал, 47% на рік. Якщо взяти, наприклад, план Master за $79 на місяць, ви отримаєте 10 000 кредитів. Кожне генерування – 25 кредитів, а короткий ролик займає більше. За математикою Chat GPT, це приблизно 400 генерацій. Вартість генерації менш ніж 20 центів. І це значно дешевше, ніж Cling, і, звісно, набагато дешевше, ніж V3.
Тож, якщо ви хочете випробувати Miniax, зараз, мабуть, найкращий час.
Що далі?
Я продовжу активно вивчатиму цю модель, бачити, що в неї добре виходить, і де вона спіткнулась. Напишіть у коментарях, якщо хочете побачити порівняння з іншими генераторами AI-відео. Можливо, ми цим займемось цього тижня, якщо не буде гучних прем’єр. Побачимо. Шанси 50 на 50. А поки що дякую, що дивилися! З вами була Ліла Гарт. До нових зустрічей!