Midjourney V7: Чи стане він “вбивцею” Flux? Перші враження та перспективи
Здається неймовірним, але це сталося! Midjourney V7 нарешті тут! Чи варте було чекати але що нового він приносить? І чи дійсно Midjourney збирається витіснити Black Forest Labs Flux? А головне – чи має це значення взагалі? Поринемо у світ Midjourney V7, розберемо його сильні сторони, недоліки та перспективи.
Рік, три місяці і чотирнадцять днів.
Саме стільки часу минуло з моменту виходу Midjourney V6, який побачив світ 20 грудня 2023 року. Звичайно, це не зовсім справедливо, адже з того часу було кілька оновлень, зокрема, версія 6. 1, яка вийшла в липні 2024 року. Все ж, навіть 8 місяців – це довгий термін. Простір між поколіннями не залишався порожнім: з’явилися Audiogram 2. 0 та 3. Чесно кажучи, 0, Black Forest Labs Flux, Frames від Runway, Stable Diffusion 3. 5, Recraft, Imagen 2 та Imagen 3, нещодавно. Звичайно, представлений розумієте, Reeve, і, звичайно, нова модель від OpenAI. Ландшафт змінився кардинально, і, як відомо, існує ціла “індустрія” хейтерів Midjourney. Тому на V7 покладено багато надій, але чи виправдаються вони? Про це ми теж поговоримо.
За лаштунками V7
Нова модель обіцяє кращу якість, більш реалістичні текстури, покращене розуміння промптів та загальну когерентність. Щоб скористатися перевагами V7, потрібно налаштувати свій персоналізований профіль. Сам процес нескладний: вам потрібно оцінити 200 зображень, швидко і. Без зайвих роздумів обираючи, яке з них ви вважаєте більш привабливим. Після цього у вас з’явиться невеличка іконка “P”, що дозволяє вмикати або вимикати персоналізацію. Для більшості тестів я вирішив залишити її вимкненою, щоб побачити, як модель працює сама по собі.
Вкладка налаштувань залишилася майже незмінною: співвідношення сторін, естетика, вибір моделі (standard або raw). У V7 з’явився режим draft, про який ми поговоримо трохи згодом. Також варто звернути увагу на швидкість: на момент. Запуску Midjourney використовує лише режими relax і turbo. Тобто, навіть якщо у вас увімкнено режим fast, генерація відбуватиметься в turbo. Простіше кажучи, це може призвести до швидкої витрати вашого ліміту.
“Тост”: простий тест для складної системи
Перший тест – просте слово “тост”. Що може бути простіше? Але саме такі прості промпти дозволяють зрозуміти, значить, як модель реагує на базові запити. Щоб уявити різницю між звичайною генерацією та персоналізованою. Ось результат запиту “тост” з моїм персональним кодом. Судячи з усього, моя персоналізація не дуже добре справляється з приготуванням тостів – вони підгоріли і, здається, були зроблені з лави. Щоб було ясно, треба буде приділити більше часу оцінюванню зображень.
Інший простий тест – слово “beauty”. Відверто кажучи, і тут ми бачимо всесвітньо відомих “дам Midjourney”, які дивляться в камеру. Якщо вже Midjourney психологічно профілює мене за допомогою оцінювання зображень, то і я маю право зробити те ж саме. Текстура шкіри виглядає значно краще, ніж у версіях 6. 1, 6 та 5, де вона мала восковий вигляд.
серії тестів з одним словом – “surreal” у форматі 2:1 та стилізацією 450. На мою думку, результат чудовий бо зображення повністю відповідають поняттю “surreal”. Midjourney часто віддає перевагу певним композиційним рішенням, особливо при співвідношенні сторін 2:1. Ми знову бачимо знайому фігуру, яка стоїть спиною до камери. Але я не можу слухайте, на це скаржитися, адже не давав жодних інших вказівок. З персоналізацією “surreal” виглядає ще краще, але це, як не як, мій особистий код. Спроба збільшити рівень “weird” виявилася невдалою – наразі ця функція не сумісна з V7.
“Замок у тумані”: ускладнюємо завдання
Наступний промпт: “Кінематографічне зображення фантастичного ландшафту. Дивно, на задньому плані замок, на передньому плані чарівник, який тримає сферу”. Варто зазначити, що бачите, проєкт Midjourney orb був закритий, але проєкт Midjourney egg все ще в розробці. Повертаючись до нашого чарівника, можна сказати, що модель загалом, досить точно відобразила все, що було в запиті. Приємно бачити варіації чарівників, а не лише Гендальфа. Хоча і Гендальф теж присутній, як і Дамблдор, який ось-ось випустить найкрутіший біт 2025 року. З моєю персоналізацією зображення стають темнішими та більш “кінематографічними”. Є невелика проблема з хватом на одному зображенні, але в цілому результат чудовий. Звичайно, ми могли б скористатися редактором, щоб виправити руку, але. Дивно, наразі використання редактора чи апскейлерів повертає вас до версії 6. 1.
Екстремальний режим: виклик від Gemini
Я звернувся до Gemini з проханням дати мені складний промпт для перевірки можливостей Midjourney. Результат вийшов досить цікавим. До речі, я не буду зачитувати весь промпт, але він. Містив багато деталей, які Midjourney чудово вдалося відтворити. Серед них – свічка у формі мініатюрного римського Колізею і яскраво-сині гриби. Ми просили три гриби, але отримали чотири. Можна посперечатися щодо розташування колібрі – він не літає на 3 дюйми вище полум’я свічки. Мабуть, не хотів повторити долю мого тосту.
Draft Mode: Швидкість та креатив у тандемі
Наразі, головною особливістю V7 є режим draft. Він дозволяє швидко генерувати ідеї та експериментувати з різними концепціями. Важливо наприклад, хоча це не працює як редактор від OpenAI. Це швидше інструмент для швидкої ітерації та генерування ідей. Draft mode працює швидко і недорого – вдвічі дешевше і в 10 разів швидше. Звичайно, уявіть собі, ціна от, за швидкість – нижча якість зображень, типу того. Але естетика та поведінка моделі залишаються незмінними. Ось невеликий тест: “Сюрреалістичний пейзаж у форматі 16:9. Лицар у сяючих обладунках на передньому плані оскільки ближчий план лицаря”. Безумовно, draft mode – розумієте, це весело і, ймовірно, стане потужним інструментом, коли з’явиться апскейлінг для V7.
Що ще не ввійшло до релізу? До речі,
На жаль, деякі функції, як Omni reference (вдосконалена версія Cref, яка підтримуватиме логотипи та об’єкти), remix і multiprompt, наразі недоступні. Простіше кажучи, також ми виявили, що команда “-weird” не працює.
Інші спостереження під час тестування
Точність у відтворенні промптів дійсно вражає. Ось приклад складного запиту: “Людина, яка сидить, схрестивши ноги, на персидському килимі, одягнена в середньовічні лати, на космічній станції”. V7 чудово впорався із завданням. Можна, звичайно, причепитися до того, що обладунки більше нагадують Warhammer 40k, ніж середньовіччя, але вони відповідають загальній естетиці зображення. Насправді, варто зазначити, що іноді зустрічаються розмиті обличчя, особливо у великих сценах. Але, враховуючи, що це лише запуск, і проблеми мають бути вирішені з виходом апскейлера, це не критично.
Висновок: Вражаючий старт, але не панацея
V7 – вражаючий старт. Чи це найкращий генератор зображень? Вирішувати вам. Midjourney має власний стиль, який не всім може подобатися. Щодо контролю – тут є над чим працювати, але стиль у Midjourney є. Чи ідеальний V7? Звичайно, ні. Але так завжди буває з Midjourney: найбільший прогрес припадає на версії. 1 та оскільки 2.
Розробники Midjourney планують випускати щотижневі оновлення протягом наступних 4 тижнів, інтегруючи нові функції. Сподіваємося, що Omni reference стане однією з перших. Цікаво, що Midjourney та Runway одночасно випустили оновлення, які не є повністю завершеними. Цікаво, особисто я не бачу в цьому проблеми – це життя, а штучний інтелект завжди перебуває у стадії бета-тестування.
Що з відео? Цікаво,
Наразі немає конкретної дати виходу відеоверсії Midjourney. Але вже відомо, що вона матиме три режими:. Текст у відео, зображення у відео та режим vary. Останній, ймовірно, працюватиме подібно до Sora – братиме початкове зображення і рухатиметься в бажаному напрямку. Мені дуже цікаво, розумієте, чи можна буде використовувати персоналізацію та стильові коди у. Режимах text-to-video, адже це може зробити Midjourney найкрасивішою моделлю перетворення тексту у відео.
Чи стане дивіться, Midjourney V7 єдиною моделлю для створення зображень?
Малоймовірно. Існує занадто багато інших генераторів зображень, щоб хтось міг претендувати на звання найкращого. До того ж, генеральний директор Midjourney Девід Хольц не зацікавлений у цій “грі”. Він все більше розглядає Midjourney як дослідницьку лабораторію. Правда, лабораторію, яка не публікує наукові статті. Але що вийде з цієї лабораторії, крім таємничого згаданого Midjourney egg? Побачимо. Я обов’язково триматиму вас в курсі.