Новий гравець на арені AI-редагування: чи зможе Seedream 4.0 потіснити лідерство Google?
Привіт, друзі! З вами Ліла Харт, і сьогодні ми поринемо у світ, де цифри оживають в образах, а код перетворюється на реальність. Уявіть, ви сидите з чашкою кави, гортаєте стрічку новин, і раптом натрапляєте на сенсаційний заголовок. Минулого тижня саме так було зі мною, коли я побачила: “Google Nano Banana знайшов серйозного конкурента!” Це як звикнути до улюбленого сорту яблук, а потім на ринку з’являється новий, ще соковитіший і ароматніший. Чи справді “бананові” часи минули, і на арену вийшов новий король редагування – Seedream 4.0 від ByteDance? І це ще не все! У мене також є свіжі новини про зниження цін на Veo 3. Знаю, це не те, чого ми очікуємо від Google. А ще вони тихцем додали те, чого багато хто з вас так довго чекав. Тримайтеся міцніше, адже наша подорож буде насиченою!
Google Nano Banana, AI-редактор, який останні кілька тижнів домінував у царині редагування зображень, тепер зіткнувся з серйозним викликом. І ім’я йому – Seedream 4.0. Але чи справді він настільки компетентний, як про нього кажуть? Мені довелося перевірити це особисто, і, мушу зізнатися, було цікаво. Ми розглянемо все: як змінювати кути камери, як працювати зі стилями, як об’єднувати кілька зображень водночас, і, звісно, порівняємо його з “бананом”. До того ж, як бонус, заглянемо у майбутнє з OpenAI та довідаємося про приємні знижки на Veo 3. Готові? Тоді пристебніть паски безпеки, адже ми вирушаємо у подорож світом AI-творчості!
Таємнича модель D3: хто стоїть за цифровим фасадом?
Все почалося кілька днів тому, коли на лідербордах аналізу штучного інтелекту з’явилася загадкова модель. Її назвали D3. І, чесно кажучи, мені це ім’я одразу не сподобалося. Коли є таке чудове слово, як “Plantain” (плантайн, родич банана), навіщо вигадувати щось менш оригінальне? Але D3 одразу привернула увагу. Спекуляції почалися миттєво: чи це OpenAI з їхнім оновленням GPT Image Model? Чи, можливо, ByteDance зі своєю четвертою версією Seedream? Тепер, коли Seedream 4.0 офіційно представлено, я можу з майже стовідсотковою впевненістю сказати: D3 – це і був Seedream. Цікаво, чи не так? Це наче детективна історія, але з алгоритмами у ролі персонажів.
Seedream 4.0: занурення у світ можливостей
Seedream 4.0, як виявилося, працює так само як і “банан”, але, здається, робить це трохи по-своєму. Наприклад, візьмемо референсне зображення і спробуємо змінити кут камери. Мені особисто видалося, що Seedream 4.0 трохи краще справляється із завданням “відвернути камеру” назад, ніж Nano Banana. Але про це згодом – є свої тонкощі.
Що мене вразило одразу – це здатність Seedream зберігати логотипи та кольорову гамму. Це особливо важливо, коли ви хочете створити серію зображень в одному стилі, наче єдину фотосесію для бренду. А ще він може використовувати вхідні зображення як референси стилю. Уявіть, ви показуєте йому картину Ван Гога, і він намагається перетворити вашу фотографію на щось подібне. Це як навчити собаку виконувати команди: спочатку диво, а далі – дивовижний трюк.
Крім того, як і GPT Image Model та Nano Banana, Seedream має генерацію на основі знань. Тобто, ви можете попросити його створити інфографіку про небезпеки недосипання або ж плакат про важливість сну. Ось як це може звучати: “Пріоритет сну для здоровішого життя”. Хоча, зізнаюся, що мені, як AI-ентузіастці, яка часто засиджується допізна, ці поради здаються дещо іронічними. Але це вже інша історія.
Чи з’їхав Seedream з “бананових” коренів?
Тепер найважливіше запитання: чи відійшов Seedream від свого попередника – “банана”? Чи це лише легке “підсолодження” того рецепту, що вже є? Давайте розберемося. Seedream 4.0 вже розгортається через API, і я тестую його на платформі Fals. Він також доступний на Replicate, і, думаю, що до кінця тижня він з’явиться всюди. ByteDance чітко націлилися на конкуренцію з Nano Banana, адже вартість однієї генерації зображення на 1 цент менша, ніж у “банана”. Це всього 3 центи! Непогано, правда? Це як отримати два квитки в кіно за ціною одного.
Перший тест: чи зникне жінка з кав’ярні?
Я почала з платформи Fals, бо там у мене накопичилося кілька кредитів. У нас є фото дівчини у кав’ярні. Завдання: прибрати її. Звісно, є різні налаштування: співвідношення сторін 16:9, 4:3, 9:16 – всі стандарти. Запускаємо! І ось воно – жінки більше немає. Генерація зайняла близько 19 секунд. Не так вже й довго. Це, звісно, був легкий тест, але результат вражає. Зверніть увагу на відблиск світла у вікні – він залишився тим самим. Також “банан” розширив частину кабіни, а Seedream додав розмиття руху іншої машини. Загалом, чудовий результат з точки зору зміни кадру та стабільності персонажа.
Ширококутний погляд: коли комп’ютер бачить більше
Ми також взяли фото, яке використовували минулого тижня – “найбільш пригнічений офісний працівник у світі” – і спробували перетворити його на ширококутний знімок. Ось що вийшло. Мене вразило, як Seedream 4.0 серйозно ставиться до запиту на широкий кут. Це, видається, еквівалент 15-20 мм об’єктива, з усіма властивими йому спотвореннями по краях. Але найдивовижніше – збереження всіх деталей: фону, предметів, навіть текстури сорочки нашого героя. Це фактично означає, що все, чого не було на початковому зображенні, Seedream генерує самостійно, але зберігає стиль. Молодці!
180-градусний поворот: чому це так складно для AI?
А тепер найцікавіше – спроба розвернути камеру на 180 градусів. Ось ці чотири темних фентезі-воїни, які думали, що дісталися кінця фільму, але насправді опинилися в трилогії. Їм ще йти через гори! І, скажу я вам, результат досить непоганий, особливо враховуючи, що модель не мала жодного уявлення про те, як виглядають ці персонажі. Є, звісно, дрібні проблеми, як-от у цього хлопця з мечем, але загалом – великий плюс. Особливо вражає стабільність персонажів на обох зображеннях. Але де ж ті 180 градусів? Складається враження, що Nano Banana, Seedream, та й інші моделі мають проблеми з виконанням цього правила. Наче вони бояться зазирнути собі за спину.
Емоції та стилі: коли AI – справжній художник
Seedream також чудово справляється зі зміною емоцій. Я випадково згенерувала зображення, де обличчя героя зазнало змін. А ще модель непогано працює з “зйомками через плече”.
Тепер про стиль. Я взяла це дивне стокове зображення (хто взагалі таке купує?) і спробувала застосувати його як референс стилю. Так, можливо, це не зовсім чесний тест, але результат мене здивував. Seedream намагався передати кольори, навіть додав якусь подобу ескізного стилю. Це майже як навчити гончаря ліпити горщики, показуючи йому фотографії стародавніх ваз.
Іншого разу я спробувала застосувати більш деталізований стиль стоп-кадру. Результат, хоч і не ідентичний до мого референсу, виявився досить цікавим. І ось що я люблю в роботі з AI – іноді він робить несподіваний поворот і надихає тебе зовсім в іншому напрямку. Тому, коли справа доходить до стилізації, найкраща порада – експериментувати. А з 3 центами за спробу це не так вже й страшно!
Коли багато – це забагато: секрети багатошарової генерації
Щодо створення кінематографічних кадрів з кількома референсами, Seedream, здається, навіть трохи випереджає Nano Banana. Але є одне “але”: чим більше референсів ви додаєте, тим більше модель починає “зламатися”. Ось, наприклад, наш герой вже не зовсім той самий, бо ми додали ще одного персонажа. Тож, якщо хочете працювати з множинними референсами, пам’ятайте: все добре в міру.
Проте, я бачила чудовий приклад від Justine Moore, де Seedream впорався з двома референсами, зберігши навіть відблиск у калюжі та загальний аніме-стиль. Це як збирати пазл, де кожна деталь має своє місце.
Наступний крок: AI-історії та цифрові світи
Seedream також добре реагує на наші вказівки. Ми вже бачили, як “банан” додавав замок у дальній план. Seedream зробив це ще краще! З естетичної точки зору, мені результат сподобався навіть більше.
А ще я хотіла перевірити, наскільки творчою може бути модель. Я надала їй зображення нуарного детектива та попросила створити комікс-панелі, де він шукає докази у злочинному місті. Результат? Чудово! Хоч і не зовсім послідовно з точки зору наративу, але модель зрозуміла завдання – кривава хустинка, похмурий склад, записка з підписом “незрозуміло”, все на місці. Це як навчити дитину розповідати казку: іноді трохи сумбурно, але суть – зрозуміла.
Чи Seedream 4.0 – “вбивця бананів”?
То чи є Seedream 4.0 “вбивцею бананів”? Ви мене знаєте. Я уникаю гучних заяв про “смерть” або “знищення”. Обидві моделі чудові, і кожна має свої сильні та слабкі сторони. Саме це і захоплює: тепер у нас є дві потужні моделі для редагування AI-зображень, і коштують вони копійки! Якщо одна не дає бажаного результату, ви завжди можете спробувати іншу. І, хто знає, можливо, невдовзі з’явиться і третя.
OpenAI готує сюрприз: GPT Image Model V…
До речі, про третю. OpenAI ось-ось оновить свою модель зображень. Вона вже з’явилася на LM Arena під назвою GPT Image One Highfidelity. І знову – жодної винахідливості в назві. Я встигла протестувати її один раз, і результат був непоганий – повний поворот до лицарів. З нетерпінням чекаю на повноцінне тестування. До речі, якщо ви хочете спробувати самі, ось вам посилання на LM Arena [посилання].
Google не спить: Veo 3 з новими можливостями та знижками!
А тепер до новин від Google. Вони не дрімають! Google оголосив про значне зниження цін на Veo 3. До цього часу це був найдорожчий генератор відео. Раніше режим “якість” коштував 75 центів за секунду, тепер – 40 центів. А режим “швидкість” подешевшав з 40 до 15 центів за секунду! Це акція “два за ціною одного” на ваші кінопроєкти.
І це ще не все! Багато хто з вас чекав на вихід 9:16 у Veo 3. І ось він – нарешті доступний! Тепер ви можете створювати контент прямо для TikTok. Google також оголосили, що Veo 3 тепер генерує у 1080p, як у режимі якості, так і швидкості. Раніше для цього доводилося використовувати окрему функцію “апскейлу”, яка іноді працювала, а інколи – ні. Тепер все простіше. Сподіваюся, за це не доведеться платити додатково. Браво, Google, за ваші старання! Чекаю з нетерпінням на 1080p “селфі” у вертикальному форматі.
Що далі?
Отже, це все на сьогодні. Я обов’язково повернуся цього тижня, щоб глибше зануритися у Seedream 4.0, особливо в його можливості генерації зображень. Пишіть у коментарях, що б ви хотіли побачити! Також, якщо ви ще не бачили моє відео про 10 секретів AI-кінематографії, обов’язково загляньте – там багато корисної інформації.
Підсумовуючи, ми бачимо, що ринок AI-редагування стає дедалі конкурентнішим. Google Nano Banana, ByteDance Seedream 4.0, OpenAI GPT Image Model – це лише верхівка айсберга. Кожна з цих технологій пропонує нові можливості та розширює межі нашої творчості. Тож не бійтеся експериментувати, пробувати нове і створювати неймовірні речі! Світ AI-творчості відкритий для вас. Залишайтеся на зв’язку, і до нових зустрічей!