Чи став ChatGPT вже “не той”? Перегони ШІ: Gemini 3 проти GPT 5.2 – хто переможе?
Звичайний зимовий день. П’ю каву, гортаю новини, й раптом – як грім серед ясного неба! Google випустив Gemini 3, і це було вражаюче. Ця модель не просто показала хороші результати, вона, здавалося, вибила килим з-під ніг OpenAI, посівши перші місця в усіх можливих рейтингах. Штучний інтелект, розуміння мови, розв’язання наукових задач – Gemini 3 був першим у всьому. Навіть на складному тесті, як “іспит для ШІ”, він показав себе найкраще.
І що ви думаєте? Жодних “ми працюємо над цим” чи “дякуємо за ваш відгук”. Президент OpenAI, Сем Альтман, публічно написав у Twitter: “Gemini 3 – чудова модель”. Це якби Apple почала хвалити Samsung за новий, кращий iPhone. Таке не трапляється, якщо ситуація несерйозна. А тут вона була ДУЖЕ серйозна.
Далі Марк Беніофф, CEO Salesforce, заявив, що переходить з ChatGPT на Gemini, випробувавши його всього дві години! Це вже не просто вибір моделі, це сигнал для всього корпоративного світу: Google випередив OpenAI. Для OpenAI це був справжній момент “ой, ні”. Вперше з 2022 року, коли Google опинився в ролі наздоганяючого з моменту запуску ChatGPT, тепер ролі помінялися. OpenAI тепер мала наздоганяти.
І знаєте, в цій шаленій гонці штучного інтелекту, де щотижня з’являються нові рейтинги, моделі та інформація, тримати це все в голові стає справжнім викликом. Я ж, тестуючи ці моделі, зрозумів, що мені потрібен центральний хаб. І я його знайшов – це AM Pro. Покажу, як він мені допомагає в роботі.
Всередині платформи є шаблони курсів за методом AMSER, і найголовніше – AMSER, мій особистий помічник зі штучним інтелектом, навчений саме на таких моделях. Якщо я попрошу його порівняти системи міркування GPT 5.2 і Gemini 3, він миттєво й чітко розкладе всі відмінності. Також є конструктор запитів, а ще додано Sora 2 Pro та VO3, що дозволяє переходити від досліджень до сценаріїв і генерації відео в одному місці. Для перших 1000 користувачів знижка 24% на річний план. Посилання – в описі під відео!
А тепер – про відповідь OpenAI.
“Код Червоний”: Коли генії починають панікувати
Згідно з внутрішніми звітами, які підтвердила The Verge, Сем Альтман надіслав мем усієї команді OpenAI: вони оголосили “Код Червоний”. Це не просто корпоративна фраза для “працюємо трохи більше”. “Код Червоний” означає: “кинути все й виправити це”.
І ось що зробили OpenAI. Вони заморозили розробку Sora – генератора відео на базі ШІ. Зупинили роботу над Pulse – персональним асистентом, про якого інтригували. Відклали агентів для покупок, рекламні інтеграції та всі експерименти з новими персонами. Усе було перенаправлено на одну мету: зробити ChatGPT швидшим, розумнішим і надійнішим за Gemini 3. Не наступного кварталу, не наступного місяця – прямо зараз.
Оригінальний план передбачав випуск GPT 5.2 наприкінці грудня, можливо, навіть на початку січня. Натомість випустили його 11 грудня. Це прискорення на три тижні. У світі розробки ШІ, де моделі потребують місяців для тренування та тестування, це фактично спринт. І це було не про додавання “крутих” функцій. GPT 5.2 не отримав нових голосів, інтерфейсів чи трюків. Це було про посилення розуміння, швидкості, надійності та краще розуміння запитів.
За даними Wall Street Journal, GPT 5.2 – це не кінець цього спринту. OpenAI вже готує новий реліз у січні, зосереджений на швидших відповідях, потужнішій генерації зображень і більш природній особистості, подібній до GPT-40. Це оновлення має офіційно завершити цю першу фазу “Коду Червоного”.
Що ж змінилося? Розбираємо по поличках
OpenAI не презентує GPT 5.2 як розкручене переосмислення. Це сфокусоване оновлення, спрямоване на надійність ChatGPT для реальної роботи, особливо в режимі “Thinking”.
1. Покращена робота зі знаннями. OpenAI публікує оцінку GDPval, де експерти оцінюють, чи модель перемагає або зрівнюється з професіоналами у чітко визначених завданнях. У GPT 5.2 “Thinking” цей показник сягає 70.9%. OpenAI наголошує, що ці завдання включають підготовку презентацій та роботу зі зведеними таблицями – реальні робочі вихідні дані, а не іграшкові запити.
2. Покращення коду та продуктивності. OpenAI наводить приклад SW Bench Pro та SW Bench Verified – двох реальних бенчмарків для кодування. GPT 5.2 “Thinking” демонструє новий рекорд на обох, включаючи 55.6% на SW Bench Pro та 80% на SW Bench Verified. Це означає вищу ймовірність, що модель зможе розібратися зі справжніми помилками, рефакторингом та багатоетапними змінами коду, не “розсипавшись” посеред завдання.
3. Менше помилок у реальному використанні. За даними OpenAI, GPT 5.2 “Thinking” менше “галюцинує” на реальних запитах користувачів. Фактичних помилок у відповідях стало приблизно на 30% менше порівняно з GPT 5.1 “Thinking”. Це безпосередньо впливає на надійність моделі під час досліджень, аналізу чи прийняття рішень.
4. Значно сильніше розуміння довгих контекстів. OpenAI відзначає найвищу продуктивність на MRCV2 – тесті розуміння довгого контексту, включаючи майже ідеальні результати на контексті до 256 тисяч токенів. GPT 5.2 “Thinking” “втрачатиме нитку” під час роботи з довгими документами, розшифровками або багаточастинними проєктами.
5. Покращення візуального сприйняття. OpenAI описує GPT 5.2 “Thinking” як свою найсильнішу візуальну модель на сьогодні, з приблизно вдвічі меншою частотою помилок у завданнях, наприклад, аналіз діаграм та розуміння інтерфейсів програм. Це безпосередньо впливає на робочі процеси, пов’язані зі скріншотами, дашбордами, діаграмами та аналізом інтерфейсів.
Загалом, GPT 5.2 – це не GPT-6, і OpenAI не заявляє про нову архітектуру. Це реліз, зосереджений на надійності. Сильніші знання, краща продуктивність, кращі результати в реальному кодуванні, менше фактичних помилок, а також значно надійніший довгий контекст та візуальні можливості, особливо в конфігурації “Thinking”.
Справжнє тестування: GPT 5.2 проти Gemini 3 – хто переможе?
Час переходити до реальних тестів. Я дав обом моделям ті самі завдання і покажу, де кожна показала себе краще.
Тест 1: Планування подорожі
Перше завдання: “Сплануйте триденну автомобільну подорож із Сан-Франциско до національного парку Йосеміті з двома зупинками по дорозі. Врахуйте бюджет у 500 доларів, віддайте перевагу пішохідним стежкам до 5 миль і уникайте платних доріг. Наведіть детальний план по днях з орієнтовними витратами”.
Gemini 3 надав солідний план. Він перерахував варіанти для піших прогулянок, оцінив витрати на пальне та проживання, запропонував бюджетні варіанти для ночівлі, детально розписавши все по днях. Плани були чітко структуровані і зрозумілі.
GPT 5.2 зробив усе те саме, але план був більш продуманим. Розклад був щільнішим, час на дорогу, прогулянки та відпочинок розподілено рівномірніше. Найдовша поїздка була на початку подорожі, а щоденні розклади здавалися менш поспішними. Нічого надзвичайного, але план був легшим для читання, дотримання і загалом відчувався більш продуманим від початку до кінця.
Переможець: GPT 5.2. Міркування моделі здалося більш послідовним і продуманим протягом усього плану.
Коли загальний ШІ б’є по стіні
Хоча ChatGPT і Gemini сильні у загальному міркуванні, вони стикаються з обмеженнями, коли потрібна специфічна автоматизація, особливо в галузі досліджень та науки. Саме тут спеціалізовані ШІ-агенти вже вириваються вперед. Я тестував SciSpace Biomed Agent – доповнення до основного агента SciSpace, спеціально створене для біомедичних досліджень.
Чому це важливо? Біомедичні дослідження розкидані по сотнях інструментів: бази даних із доступом за плату, платформи секвенування, постійно оновлювані набори даних. Biomed Agent об’єднує понад 150 спеціалізованих біомедичних інструментів і автоматизує весь процес одним запитом.
Реальний приклад: Я попросив передбачити профілі безпеки певного препарату. Зазвичай це потребує трьох різних платформ і ручного зіставлення даних. Той самий агент обробляє клінічну геноміку, інтерпретацію варіантів, аналіз реакцій, CRISPR-протоколи – будь-яке біомедичне завдання.
І ще бонус: генерує наукові ілюстрації, готові для публікації. Подивіться на цей приклад. Діаграму, яку зазвичай доводиться годинами створювати самому або замовляти у дизайнера, SciSpace створив миттєво.
#Sponsored Спробуйте SciSpace: https://scispace.com/biomedical?via=a…
Використовуйте код AIMBIO40 для знижки 40% на річний план та AIMBIO20 для знижки 20% на місячний план!
Тест 2: Генерація коду для дашборду
Далі – кодування. Потрібно щось, що можна побачити на екрані, а не просто цифри в консолі. Завдання: “Створи простий односторінковий щоденний дашборд. Вимоги: заголовок з моїм ім’ям, розділ для сьогоднішніх завдань, невелика область для нотаток та вбудований таймер фокусу”.
Gemini 3 згенерував чистий макет з усіма потрібними розділами. Код спрацював, і сторінка завантажилася з базовим, але функціональним дизайном.
GPT 5.2 створив схожу сторінку, але вона одразу виглядала більш схожою на реальний дашборд. Макет був більш структурованим, з чіткими розділами у вигляді карток, читабельним шрифтом та тонкими деталями інтерфейсу, які робили сторінку “готовою”, а не “чернеткою”. Таймер фокусу також був більш функціональним: включав кілька попередньо встановлених режимів та слайдер для точного налаштування часу, що робило його гнучкішим за базовий таймер Gemini.
Переможець: GPT 5.2 з невеликою перевагою. Обидві моделі можуть створити робочу сторінку, але GPT 5.2 негайно надає більш відполірований та зручний інтерфейс. До того ж, ChatGPT може показати попередній перегляд прямо в чаті, що зручно для миттєвої візуалізації без завантаження файлів. Gemini ж пропонує лише зберегти HTML локально.
Тест 3: Аналіз календаря
І останнє – робота з зображеннями. Я взяв скріншот свого тижневого календаря, заповненого зустрічами, дзвінками, завданнями та особистими подіями. Поставив обом моделям одне запитання: “Подивися на цей календар і назви три речі: які дні перевантажені, де у мене конфлікти часу, і як би ти перепланував цей тиждень, щоб зробити його більш керованим”.
Gemini 3 правильно визначив найзайнятіші дні та позначив очевидні подвійні бронювання. Він запропонував перенести кілька зустрічей на менш завантажені дні та додати один довший блок фокусування замість кількох коротких. Це була цілеспрямована, практична порада.
GPT 5.2 пішов далі. Він згрупував схожі зустрічі, об’єднав короткі розсіяні завдання у більші фокусовані блоки та надав чіткий план реорганізації тижня з визначеними межами для глибокої роботи та відновлення. Замість окремих порад, він запропонував структурований підхід, який робив тиждень реалістичним та стійким для звичайної людини.
Переможець: GPT 5.2. Обидві моделі зрозуміли календар, але GPT краще перетворив захаращений тиждень на реалістичний та менш стресовий план.
Швидкість: не число, а відчуття
Швидкість у чат-моделях зі штучним інтелектом – це не просто “швидше чи повільніше”. Вона залежить від багатьох факторів: навантаження на сервер, налаштувань моделі, складності запиту та відповіді. Замість “зупиночних” показників, важливіше практичне значення. OpenAI позиціонує GPT 5.2 як модель, оптимізовану для робочих процесів, чутливих до затримки, тобто вона створена для швидкого повернення корисних результатів у повсякденному використанні, а не лише у штучних бенчмарках.
Для мене, у реальній роботі, найважливіше – як ефективно я отримую якісну відповідь, яка відповідає запиту, а не сира швидкість відповіді.
Що далі? Наша “піч” та майбутні дива
Але швидкість – це одне, а те, що насувається – зовсім інша історія. GPT 5.2 – це не кінцева мета OpenAI. Це тимчасовий міст, швидкий удар, щоб повернути втрачені позиції, поки вони працюють над чимось набагато більшим.
За інформацією ззовні, OpenAI також працює над архітектурою наступного покоління під кодовою назвою Project Garlic. Це не просто інкрементальне оновлення. Garlic, як повідомляється, побудований на основі ефективного попереднього тренування. Ідея полягає в тому, щоб навчити меншу модель досягати знань та можливостей набагато більшої моделі.
Чому це важливо? Менші моделі працюють швидше, коштують дешевше в експлуатації та можуть бути розгорнуті в більшій кількості місць: на телефоні, на периферійних пристроях або в корпоративних системах, де вартість обчислень є критичною. Виходячи з тих самих звітів та витоків від людей, знайомих з проєктом, Garlic може з’явитися вже на початку 2026 року, можливо, як GPT 5.5 або навіть GPT 6. Деякі джерела стверджують, що перші внутрішні результати виглядають вражаюче щодо кодування, міркування та швидкості, при цьому використовуючи менше ресурсів.
GPT 5.2 – це міст. Він дає OpenAI час завершити Garlic, не віддаючи ринок Google. І це розумна стратегія, бо якби вони чекали, поки Garlic буде готовий, щоб відповісти на Gemini 3, вони ризикували б втратити корпоративних клієнтів та довіру розробників на місяці.
Якщо ви користувач ChatGPT Plus або Pro, GPT 5.2 вже розгортається для вас. Вам не потрібно нічого робити. Коли розгортання дійде до вашого облікового запису, ви побачите GPT 5.2 в списку вибору моделі. Якщо ви на безкоштовному рівні, GPT 5.2 може бути ще недоступним. OpenAI каже, що розгортання починається з платних планів і поступово розширюється. Тож, якщо ви не бачите його одразу, перевірте пізніше.
Як витиснути максимум з GPT 5.2 вже зараз:
- Використовуйте його для завдань, що вимагають багатоетапного міркування. Якщо ви плануєте проєкт, налагоджуєте код або аналізуєте складні дані, саме тут GPT 5.2 сяє порівняно з попередніми версіями.
- Скористайтеся швидкістю. Якщо ви ітеруєте над запитами, переглядаєте тексти, тестуєте різні підходи, вдосконалюєте вихідні дані – швидший час відгуку суттєво пришвидшує роботу. Ви зробите більше за менший час.
- Використовуйте мультимодальність. Завантажуйте скріншоти, діаграми, графіки або фотографії та попросіть GPT 5.2 витягти з них ідеї. Він надійніше розуміє візуальний контекст, ніж попередні моделі GPT.
- Будьте конкретні щодо формату. Одне з покращень у 5.2 – краще дотримання інструкцій щодо форматування. Якщо вам потрібен JSON, так і скажіть. Якщо потрібна таблиця, вкажіть стовпці. Модель менш ймовірно відступить від ваших інструкцій у середині процесу.
Кому ж довіряти? ChatGPT чи Gemini?
Головне питання: чи варто залишатися з ChatGPT, чи переходити на Gemini 3?
Якщо швидкість і надійність – це найважливіше (наприклад, ви використовуєте ШІ для кодування, робочих процесів, бізнес-аналізу чи будь-чого, де потрібні стабільні, надійні результати), то ChatGPT 5.2 – кращий вибір на даний момент. Він швидший, робить менше помилок і інтегрується з величезною екосистемою сторонніх інструментів через API OpenAI.
Якщо ваш пріоритет – найсучасніша мультимодальність, і ви багато працюєте із зображеннями, відео, науковими діаграмами або завданнями візуального міркування, то Gemini 3 все ще має невелику перевагу. Він краще справляється з абстрактним візуальним мисленням та завданнями, що вимагають розуміння складних просторових відносин.
Для більшості людей, розрив настільки незначний, що вибір зводиться до того, на якій платформі ви вже інвестовані. Якщо ви вибудували робочі процеси навколо ChatGPT, кастомних GPT та інтеграцій OpenAI, немає нагальної причини переходити. GPT 5.2 закрив розрив у продуктивності, який відкрив Gemini 3.
Якщо ви починаєте з нуля, і ваша робота має сильний візуальний або науковий характер, Gemini 3 варто спробувати. Але для загального використання ШІ, написання текстів, кодування, аналізу – ChatGPT 5.2 повернув собі місце як найнадійніший варіант.
Гонка ШІ не закінчилася, вона лише прискорюється. Gemini 3 змусив ринок перекалібруватися. Відповідь OpenAI – GPT 5.2, з оновленнями: сильніше міркування, краща продуктивність довгого контексту, покращене використання інструментів та чітке бачення.
Це не статична гонка. Моделі швидко змінюються. Якщо ви будуєте щось серйозне на їх основі, доведеться залишатися гнучкими і регулярно перетестовувати робочі процеси.
Якщо ви хочете бути на крок попереду, не потонувши в інформаційному перевантаженні, перевірте AM Pro. Там я відстежую, тестую та вивчаю все в одному місці. Для перших 10 000 членів – 24% знижка на річний план. Посилання внизу.
Дякую за перегляд! До зустрічі в наступному відео!







