Звісно, ось стаття, написана у стилі Ліли Гарт, на основі наданої вами транскрипції відео:
Епоха змін у світі AI – Нова ера з GPT-4.1 та її наслідками
П’янко звучить ехо слів, та саме вони стають точкою перетину, щоб зануритись у закручений світ AI. OpenAI випустили GPT-4.1, але як завжди, це більше ніж просто модель. Це крок, до якого, на жаль, не всі готові.
Перше, що потрібно знати: GPT-4.1 буде доступним лише через API. Чому? Відповідь криється в тому, що GPT-4.1 створена для розробників. Вона не призначена для звичайного користувача через інтерфейс чату. Але не переймайтесь, поступово всі покращення, які має GPT-4.1, включаються в GPT-4.0.
Отже, GPT-4.1 не є кардинально іншою від GPT-4.0. В деяких областях, вона навіть дуже відрізняється. Ось чому її зроблено спеціальною для розробників. Але якщо ви все-таки хочете випробувати GPT-4.1 через інтерфейс чату, то можна скористатись ресурсом openrouter.com.
OpenRouter – це уніфікований інтерфейс для LLM: він має чудові ціни, кращий час безперебійної роботи і відсутність підписки. Перейдіть в чат, створіть нову кімнату, виберіть значок моделі, вкажіть GPT-4.1, натисніть “застосувати”, і готово!
Але GPT-4.1 – не єдина модель, яку випустили. OpenAI представили також дві менші версії, які відрізняються для різних потреб.
- Найрозумніша модель для складних завдань: має довгу контекстну пам’ять – понад 1 мільйон токенів. Максимальна кількість вихідних токенів – 32000. Ціна теж відносно низька у порівнянні з іншими моделями. Текст на виході, текст з картинками на виході, і час очікування як у GPT-4.0.
- GPT-4.1 Mini: швидша за GPT-4.0 на 40%. Можна сказати, що це – модель, яка поєднує у собі швидкість та інтелектуальність.
- GPT-4.1 Nano: найшвидша та найекономічніша модель для завдань з малою затримкою. Дешева модель, яка здатна вирішувати багато задач. OpenAI зробили це, тому що зараз є багато моделей, які здатні виконувати різні задачі відносно дешево.
OpenAI наголошують на практичній реалізації. Це не просто цифри та тести. OpenAI хотіли зосередитися на моделях, які мають реальне застосування.
Дані з деяких бенчмарків показали, що GPT-4.1 перевершила всі інші моделі у тестуванні.
GPT-4.1 значно краще за GPT-4.0 в сфері інженерії, зокрема, вирішенні задач кодування, вирішенні завдань кодування, фронтенд-кодингу, створенні мінімальної кількості змін, дотриманні форматів диференціації, забезпеченні послідовного використання інструментів та багато іншого.
Це навіть краще за OpenAI 03 Mini, що є дійсно вражаючою моделлю, та OpenAI 01 high.
У сфері кодингу, GPT-4.1 – супермодель у порівнянні з іншими моделями.
Увага, технічний жаргон закінчиться через слайд.
GPT-4.1 має суттєве покращення, яке видно у графіках.
Якщо візуалізувати GPT-4.1, то це досить корисно, щоб зрозуміти, де знаходиться модель. Інтелект зліва, затримка внизу.
GPT-4.1 Nano – ефективний інструмент для балансування затримки та інтелекту. GPT-4.1 Mini, ймовірно, найкращий у балансуванні, оскільки він відносно розумний і також відносно швидкий і дешевий.
Тож, він може стати одним з найбільших претендентів на рівні з Gemini 2.5 flash, оскільки цей продукт – надзвичайно дешевий і має чудовий інтелект.
OpenAI робили акцент на застосуванні у реальному світі. Вони хотіли оптимізувати моделі для вирішення завдань, які найважливіші для застосування.
Відмінні показники GPT-4.1:
- Windinssurf GPT-4.1 на 60% вищий, ніж GPT-4.0 у внутрішньому тестуванні кодування.
- Користувачі Windinssurf відмітили, що GPT-4.1 на 30% ефективніший при викликах інструментів і приблизно на 50% рідше повторює непотрібні редагування або читає код поетапно.
- GPT-4.1 на 53% точніше, ніж GPT-4.0 у внутрішньому тестуванні реальних складних сценаріїв оподаткування цієї компанії.
- Зростання точності – ключове для як продуктивності системи, так і задоволеності користувачів. Воно підкреслює покращене розуміння GPT-4.1 складних правил і здатність дотримуватися нюансованих інструкцій протягом тривалого контексту.
GPT-4.1 має надзвичайно довге вікно контексту.
Для візуалізації того, наскільки добре відбувається пошук інформації, вони зробили тест на точність needle in haystack. У ньому вони показують, що модель дуже ефективно відтворює інформацію в контексті 1 мільйон токенів.
1 мільйон токенів – це більше восьми копій усієї кодової бази React.
У інших областях з довгим контекстом модель дивовижно добре показала себе у довгому контексті відео. Вона показує себе краще за GPT-4.0.
У сфері зображень вона не досягла шалених показників. Але для тих, хто хоче створювати програми, які мають візуальний компонент – GPT-4.1 Mini стане найбільш вдалим рішенням. Модель показує 73% на MMU, що практично схоже на GPT-4.1 з точки зору візуальних можливостей, але коштує набагато дешевше.
GPT-4.1 показує відмінні результати в порівнянні з іншими моделями на ринку:
У тестуванні кодування, GPT-4.1 розмістилася відразу за Claude 3.7 Sonnet і Gemini 2.5 Pro.
Тож, ця модель не є невдахою, як інші компанії. Це крута модель для коду і багатьох інших речей у реальному світі.
GPT-4.1 – це модель, яку легше підключати до різних додатків. А ось для повсякденного спілкування, наприклад, краще використовувати GPT-4.5 (але її приберуть).
GPT 4.5 буде видалено з API на літо 2025 року, щоб розробники могли перейти на нові технології.
Використання GPT-4.5 було занадто дорогим з точки зору показників.
Тож, у вас буде час використати всі можливості GPT-4.5 до 14 липня 2025 року.
У візуальному плані, GPT-4.1 демонструє суттєві покращення у фронтенд-кодуванні. Це дає змогу створювати веб-додатки, які є більш функціональними та естетичними.
У порівняльних тестах, людські експерти віддавали перевагу веб-сайтам GPT-4.1 у 80% випадків.
GPT-4.1 краще кодує фронтенди.
Але варто було порівняти її з іншими моделями.
Отже, що ви думаєте про ці три різні моделі? Чи збираєтеся ви їх використовувати? Якщо ви розробник, чи схвильовані ви? Я буду використовувати це, щоб будувати агентів практично сьогодні, і буде надзвичайно цікаво побачити, як я справляюся.
Якщо вам сподобалося відео, не забудьте поставити лайк і підписатися.