Flux 2: Чи дійсно німецькі лаборанти створили шедевр, чи це ще той “жуй”?

    Здається, ще вчора ми обурювалися, як Google знову вразив (чи, може, налякав) новинами про свої ШІ-розробки, а світ технологій уже готується до нових захопливих відкриттів. І от, наче з-під ялинки, з’являється новина, на яку багато хто чекав: Black Forest Labs, ті самі німецькі майстри, випустили довгоочікуваний Flux 2. Чи вдалося їм створити щось справді вишукане, чи це лише чергова спроба повторити успіх, але з відчутним присмаком “жуй”? Давайте розбиратися, зручно вмостившись, адже пригоди тільки починаються.

    Останнім часом штучний інтелект набрав таких обертів, що часом здається, ніби ми живемо у фантастичному фільмі, де щодня хтось винаходить чергову “машину часу” чи “квантовий комп’ютер”. І коли, здавалося б, уже нічим не здивуєш, з’являється Flux 2. Це не просто оновлення – це крок уперед, який обіцяє нам реалістичніші зображення, глибше розуміння деталей і, головне, розширені можливості для нас, креативників.

    Нові технології я люблю порівнювати з кулінарними шедеврами. Коли Black Forest Labs вперше випустили Flux 1, це було як перша спроба спекти домашній хліб. Смачно, але з нюансами. Згодом з’явилися Flux Tools – це було схоже на додавання вміння “домальовувати” відсутні частини, додавати глибину. А Flux Context став майже як “універсальний кухар”, який міг і редагувати, і доповнювати. І ось, нарешті, Flux 2. Це вже не просто хліб, це, схоже, цілий гастрономічний фестиваль, де кожен компонент доведений до досконалості. 4 мегапікселі реалістичності, увага до найдрібніших деталей, таких як руки, стопи, тканина, улюблені логотипи – це серйозно.

    Німці, як відомо, полюбляють не тільки порядок, а й точність. Тож не дивно, що Flux 2 розуміє команди в JSON – так дизайнери та розробники спілкуються з кольорами за допомогою шестизначних кодів. Це ніби вони навчилися говорити нашою професійною мовою! Це відкриває цілий новий світ можливостей.

    Але не будемо поспішати. Поки ми розбираємося з Flux 2, світ не стоїть на місці. З’явилася також нова відкрита модель для відео – Hunyuan Video 1.5 від Tencent, яка, на радість багатьом, не потребує “застави” у вигляді 20 000-доларової відеокарти. І, мов вишенька на торті, на горизонті з’являється новий гравець, що може кинути виклик “банановому трону” (знаєте, тому самому, який був минулого тижня).

    Готові поринути у світ цифрових шедеврів, розібратися з плюсами та мінусами нової технології та, можливо, навіть знайти свого нового улюбленого “помічника”? Тоді вперед зі мною!


    Розділ 1: Flux 2 – Чи справді важить?

    Почнімо з головного героя – Flux 2. Для тих, хто не стежив за пригодами Black Forest Labs, коротко нагадаю:

    • Серпень 2024: З’явився Flux 1. Це була перша спроба, проба пера, яка показала їхні можливості.
    • Листопад 2024: Ми отримали Flux Tools. Тут уже стало цікавіше: з’явилася функція “заповнення”, що дозволяла реставрувати зображення, працювати з глибиною.
    • Травень 2025: На світ з’явився Flux Context. Це вже був просунутий інструмент для редагування зображень.
    • І ось, сьогодні: Flux 2. Це ніби всі попередні версії зібрали разом, додали секретних інгредієнтів і отримали… що?

    Flux 2 обіцяє деталізацію до 4 мегапікселів. Уявіть: не просто картинка, а така, що можна розглядати кожну цяточку. І найголовніше – руки, ноги, тканина, логотипи та дрібні предмети. Це те, що завжди було проблемою для ШІ-генераторів. Часто руки виглядали як павучі лапки, а тканина – як пластик. Flux 2 нібито це виправляє.

    Цікаво знати: Flux 2 також розуміє JSON (хоча це не новинка, багато моделей це вміють, але, за словами розробників, їхня реалізація оптимізована) та Hex-коди кольорів. Це не просто “червоний” чи “синій”, а конкретний код, як у професійних дизайнерів. Це як у рецепті: не просто “додай спецій”, а “додай 2 грами базиліку та дрібку шафрану”. Точність!

    І, звісно, реальне знання про освітлення та просторову логіку. Це означає, що тіні будуть там, де треба, об’єкти виглядатимуть об’ємно, а не плоско.

    Flux 2 буде доступний у кількох “версіях”:

    • Flux 2 Pro – для професіоналів.
    • Flex – гнучка версія.
    • Dev – для розробників.
    • Klein (скоро) – це буде відкрита версія! Ура!
    • VAE – вже доступна на HuggingFace.

    І де його шукати? Та скрізь! Німецька точність працює за принципом “щоб було все”.


    Розділ 2: Таємничий персонаж у синьому костюмі та таємниці Шварцвальду

    А тепер найцікавіше – тестування. Ми ж не будемо вірити на слово, чи не так? Творці Flux Playground нам допомогли.

    Пройдімось за сценарієм. Пам’ятаєте того персонажа в синьому костюмі, якого ми бачили минулого тижня? Він знову з’явився, цього разу ніби з таємничої скриньки з чимось, що він точно не повинен був відкривати (особливо біля Зони 51, ну хто так робить?).

    Зображення персонажа в синьому костюмі з Flux 2

    І знаєте що? Результат вражає. Картинка вийшла “солідна”. Все, що просили – отримали. Наш “друг-вовк” (який, схоже, нерозлучний з цим персонажем) на місці, пил у повітрі виглядає природно, освітлення на обличчі – просто клас! Особливо порадувала текстура шкіри – вже немає цього “воскового” ефекту, який псував багато зображень. Це вже не пластикова лялька, а майже жива людина (чи хто він там за видом).

    Далі – астронавт, який п’є каву біля паризького кафе. Це вже справжній виклик для ШІ: люди, жести, рефлекси у візорі.

    Зображення астронавта з Flux 2

    Що можу сказати? Flux 2 демонструє свою здатність генерувати руки. Я не бачу жодних “кривих пальців”, які так часто траплялися. А рефлекси у візорі – це щось! Єдиний маленький недолік – ручка від кави. Ну, майже. Хто п’є каву, тримаючи її за блюдце? Правильно – найкрутіші астронавти, які люблять “подвійне вживання”. Тож – зарахуємо.


    Розділ 3: Пірати, кавуни та “ефект банана”

    А тепер – піратська вечірка! Це вже справжній хаос, але саме в такому хаосі приховані найцікавіші деталі.

    Зображення піратів з Flux 2

    Картинка насичена деталями. Ці двоє позаду… Ну, дехто може сказати, що це “штучний інтелект накосячив”, але, знаєте, хто їх знає, цих піратів? Може, вони так і сидять! Я не суджу.

    Але ось що я помітив: Flux 2 іноді схиляється до “ілюстративного” стилю. Це гарно, але не завжди те, що потрібно. На щастя, є спосіб це обійти. Пам’ятаєте, як я розповідав про “ефект банана” (ну, той інструмент, що ми тестували минулого тижня)? Це коли для кращого результату треба підказати ШІ.

    Зображення Fallout Vault Dweller з Flux 2

    Я взяв старий запит “Fallout-style Vault Dweller” і додав зображення-референс з Midjourney. І що ви думаєте? Flux 2 видав ось такий результат. Він не тільки перейняв стиль, а й зберіг персонажа з мого референсу! Це вже серйозно.

    Зображення FBI Agent з Flux 2

    І це підтверджується наступним тестом. Мій улюблений “агент ФБР, що п’є каву в придорожньому кафе Тихоокеанського північного заходу”. Зліва – Midjourney, справа – Flux 2. Я вражений! Flux 2 зберіг персонажа, навіть з його тінями, і додав… дві кави! Так, схоже, Flux 2 – справжній кавоман. Але стабільність персонажа – це те, що ми давно шукали.


    Розділ 4: Складні сценарії та “третя рука” – перевірка на міцність

    А якби взяти кілька зображень і скласти з них одну сцену? Це вже вищий пілотаж. Я взяв двох персонажів та локацію, які ми вже бачили з “Nano Banana Pro” (так, я знаю, це інша модель, але порівняння цікаве).

    Порівняння Flux 2 та Nano Banana Pro

    Flux 2 створив ось таку картинку. Мені подобається, персонажі виглядають органічно в цій локації. Nano Banana Pro теж непоганий, але… персонажі виглядають так, ніби їх “вставили” зверху. Flux 2 краще “вписав” їх.

    Цікаво знати: Так, зізнаюся, в одній з генерацій Flux 2 подарував нам “третю руку”. Але, знаєте, це мене навіть порадувало! Це як знайти старий прикольний дефект у вінтажній речі. Це ж так мило! І, звісно, це виправляється простим запитом: “Видали третю руку”.

    А тепер – моя “велика біла китова” мрія: обійти правило 180 градусів, тобто показати протилежний бік кімнати.

    Тест на 180-градусне правило з Flux 2

    Flux 2 майже це зробив! Ми бачимо протилежний бік. Модель “додумала” його, бо його насправді не було на вихідній картинці. Але правило 180 градусів ще не зламано.

    Порівняння Nano Banana Pro з Flux 2

    Nano Banana Pro тут впорався краще. Він “розвернув” персонажів, зберігши правило, і навіть додав столик. Але, знову ж таки, Flux 2 виглядає естетичніше, коли йдеться про інтеграцію персонажів.


    Розділ 5: Слів багато, а картинка де? Hunyuan Video 1.5 та загадкові відео

    Переходимо до відео. Минулого тижня, поки всі обговорювали новини від Google, з’явилася нова відкрита модель для генерації відео – Hunyuan Video 1.5 від Tencent.

    Логотип Tencent

    І знаєте що? Вона не потребує “золотого” комп’ютера. Достатньо однієї відеокарти Nvidia з 14 ГБ пам’яті. Це вже схоже на реальність для багатьох! Вона може генерувати 5-10 секунд відео у роздільній здатності до 1080p (хоча 1080p на 14 ГБ – це вже виклик).

    Я ще не встиг протестувати її детально, бо був зайнятий іншими справами (готую для вас дещо цікаве на наступний тиждень!), але вона вже доступна локально і навіть на Comfy Cloud (до речі, я теж починаю до неї придивлятися).


    Розділ 6: Новий претендент на троні? Bytedance та “таємний шепіт”

    А тепер – інсайд! Схоже, у “бананового трону” з’явився новий, дуже сильний конкурент. І він від Bytedance (так-так, ті самі, що створили TikTok). Їхня таємнича модель “Lab” – це щось!

    Логотип Bytedance

    Порівняймо: зліва – Nano Banana, справа – “Lab”.

    Порівняння Bytedance Lab та Nano Banana

    Переваги “Lab”:

    • Рідна роздільна здатність 2K: Висока якість “з коробки”.
    • До чотирьох зображень одночасно: Це значно прискорює роботу.
    • Пози поза референсом: Модель чудово розуміє, як поставити персонажа.

    Приклад пози від Bytedance Lab

    Приклад пози від Nano Banana Pro

    Ця модель зараз доступна лише в Китаї, але я буду уважно стежити, коли вона з’явиться на їхній західній платформі Dreamina.

    І наостанок – ще одна загадка. У списку лідерів “artificial analysis” з’явилася нова таємнича модель Whisper Thunder.

    Приклад зображення від Whisper Thunder

    Я не знаю про неї майже нічого, крім того, що вона генерує доволі якісні панорамні кадри. Ось, наприклад, дивна, але цікава сцена: “чоловік з масла починає танути на кухні”. 🫠

    Приклад відео від Whisper Thunder

    Відео виходить з роздільною здатністю 720p, тривалістю близько 5 секунд. Музиканти в метро, чоловік із шоколаду, що йде дощу… Все це виглядає стабільно, без дивних перетворень. Я обов’язково розкопаю більше інформації про Whisper Thunder.


    Висновок: Flux 2 – крок до майстерності, але чи вийде “шеф-кухар”?

    Отже, що ми маємо? Flux 2 – це, безперечно, величезний крок уперед. Він подолав багато бар’єрів, які раніше здавалися нездоланними, особливо в деталізації та стабільності персонажів. Німці з Black Forest Labs справді “дали жару”, і їхній новий продукт – це вже серйозна заявка на місце під сонцем.

    Порівняння з “Nano Banana Pro” показує, що кожна модель має свої сильні сторони. Flux 2 блискуче інтегрує об’єкти та персонажів, тоді як інші моделі можуть краще розуміти простір або зберігати загальний вигляд композиції. Але, враховуючи наявність “третьої руки” та інші дрібні недоліки, варто пам’ятати, що це частина процесу навчання.

    Hunyuan Video 1.5 – це чудова новина для тих, хто давно мріяв про локальну генерацію відео. Це робить потужні інструменти доступнішими.

    А Bytedance “Lab” та Whisper Thunder – це ті “приховані козирі”, за якими варто стежити. Вони показують, що конкуренція в сфері ШІ лише посилюватиметься, а це означає, що нам, користувачам, буде ще цікавіше.

    Що далі?

    1. Експериментуйте! Якщо у вас є доступ до Flux 2, спробуйте його. Знайдіть ті “смаки”, які вам найбільше підходять.
    2. Слідкуйте за новинами. Відкриті моделі, такі як Hunyuan Video 1.5 та майбутній Flux 2 Klein, відкриють нові горизонти для творчості.
    3. Спілкуйтеся! Діліться своїми результатами, своїми знахідками. Саме так ми разом рухаємося вперед.

    Технології змінюються зі швидкістю світла, але головне – не загубитися в цьому шаленому темпі, а знаходити інструменти, які допомагають нам творити, мріяти та бачити світ у нових барвах. Flux 2 – це саме такий інструмент. Він ще не ідеальний, але вже надзвичайно потужний.

    До зустрічі в наступному відео (або статті)!

    Поділитися.
    0 0 голоси
    Рейтинг статті
    Підписатися
    Сповістити про
    guest
    0 Коментарі
    Найстаріші
    Найновіше Найбільше голосів
    Зворотній зв'язок в режимі реального часу
    Переглянути всі коментарі
    0
    Буду рада вашим думкам, прокоментуйте.x