Gemini 3: Мислитель чи черговий крок? Огляд з Lila Hart

    Привіт, друзі! Сьогоднішній ранок розпочався з роздумів про те, чи справді ми на порозі ери, де машини не просто виконують команди, а й думають? Саме коли я заглибилася в ці філософські роздуми, надійшла електронна пошта від Google із запрошенням випробувати їхню нову модель Gemini 3. “Тільки не розповідай нікому до офіційного анонсу!” – попросили вони. Звісно, я чекала, але мозок уже працював на повну. І ось він, вирішальний момент! Сьогодні ми дослідимо Gemini 3, його можливості, новий “агентський режим” і поділюся з вами всіма враженнями: від захоплення до, можливо, деякої незграбності. Пристебніть ремені, попереду захоплива подорож!

    Gemini 3: Що це за дивовижний звір?

    Минулого тижня Google випустила Gemini 3 – справжній прорив. Це не просто оновлення, це новий рівень. Уявіть, ваш комп’ютер став не тільки швидшим, а й розумнішим. Gemini 3 – це їхня новітня флагманська модель, яка претендує на лідерство.

    Порівняно з Gemini 2.5, попередником, заявлено про значні покращення у чотирьох ключових сферах:

    1. Міркування: Складні багатоетапні завдання з логікою, планування та вирішення проблем, що вимагають “інтелектуальної активності”.
    2. Кодування: Написання, рефакторинг коду, розуміння великих кодових баз – усе на новому рівні.
    3. Мультимодальність: Здатність обробляти текст, зображення, діаграми, документи та навіть довгі відео одночасно.
    4. Довгий контекст: Збереження зв’язності та розуміння в довгих діалогах, великих текстових запитах або навіть повних відео.

    Іншими словами, це модель для тих випадків, коли потрібно, щоб хтось справді подумав над задачею, а не просто дав швидку відповідь.

    Як щодо показників? Бенчмарки як лакмусовий папірець

    Google поділився вражаючими результатами тестів. Хоча я зазвичай ставлюся до бенчмарків з певною часткою скептицизму, ділитися інформацією про нового лідера варто.

    • Humanity’s Last Exam: Тест на багатоетапне міркування та знання гуманітарних наук на рівні експерта. Gemini 3 Pro показав 37,5% без використання інструментів. Це серйозно, адже вище попередніх результатів, і Gemini 3 стає новим лідером, випереджаючи GPT-4 Pro (31,64%).
    • GPQA Diamond: Питання з науки на рівні PhD. Тут Gemini 3 досяг 91,9%, обійшовши GPT-5.1 (87,6%).

    Майже всі інші тести підтверджують: Gemini 3 – новий король великих мовних моделей. На папері це невеликий крок, а стрибок у здатності “розумнішати” над складними задачами. Але справжня перевірка чекає в реальному застосуванні.

    Де ж можна випробувати це диво? Доступність Gemini 3

    Цифри – одне, реальність – зовсім інше. Де ми можемо “помацати” Gemini 3?

    • Google Search: Якщо ви в США та використовуєте підписки Google AI Pro або Google AI Ultra, ви вже бачите Gemini 3 в дії в режимі AI. Але, як це часто буває, стосується платних планів.
    • Додаток Gemini: Додаток Gemini на вебі вже використовує Gemini 3 “під капотом”.
    • AI Studio: Розробники можуть будувати з Gemini 3 зараз через AI Studio або командний рядок (CLI). Приємно, що доступно для всіх рівнів користувачів AI Studio, тобто, схоже, гратися з новою моделлю можна буде безкоштовно.
    • Google Anti-gravity: Нове середовище розробки, яке скоро вийде в публічний прев’ю та буде доступним на Mac, Windows і Linux. Gemini 3 буде основою багатьох його функцій.

    З першого дня Gemini 3 вже в пошуку, додатку Gemini, AI Studio та CLI, а також у розробницьких інструментах. Звучить як досить масштабний старт!

    Deep Think та Gemini Agent: Коли ШІ починає “думати” та “діяти”

    Окрім моделі Gemini 3, Google анонсував Gemini 3 Deepthink та Gemini Agent.

    Gemini 3 Deepthink – це режим “глибокого мислення”. Уявіть, ви просите друга подумати про щось довше, щоб він краще зрозумів. Зараз цей режим доступний тільки тестувальникам безпеки, а потім з’явиться у підписників Google AI Ultra (250 доларів на місяць!). Призначений для найскладніших задач, де потрібен довгий процес міркувань та багатоетапне мислення.

    Починається справжня магія з Gemini Agent. Функція у веб-додатку Gemini, яку авторка статті мала змогу тестувати заздалегідь. Цей агент може не тільки відповідати на запитання, а й діяти: читати ваші листи, знаходити документи на Google Drive, створювати презентації, бронювати речі в інтернеті.

    Важливо! Ця функція поки що доступна лише у веб-версії, вона експериментальна. Google неодноразово наголошував: наглядайте за ним! Деякі сайти можуть його блокувати, іноді він може діяти без підтвердження, а ви несете відповідальність за його дії. Тож, якщо використовуватимете цю нову функцію, робіть це обережно. Ми спробуємо її в дії на камеру трохи далі.

    Технології Штучного інтелекту: Коли продуктивність зустрічається з гармонією (і змаганням)

    Світ ШІ – це вир можливостей. Як творцю контенту, я бачу, як ШІ допомагає мені прискорити багато рутинних завдань. Але колись це було справжнє пекло – купа різних інструментів, між якими перемикаєшся, втрачаючи більше часу, ніж заощаджуючи. Саме тому мене так захопила робота компанії Make.

    Уявіть візуальну панель керування для всіх ваших ШІ-інструментів. Не потрібно перемикатися між десятками вкладок, ви бачите, як усе працює разом. Наприклад, я створив собі “агента для зростання аудиторії”:

    • Агент даних збирає аналітику з YouTube Studio.
    • Агент трендів аналізує, які теми контенту “заходять” найкраще.
    • Агент планування генерує план контенту на наступний тиждень і надсилає його мені та моєму продюсеру.
    • Агент звітності щоп’ятниці надсилає звіт про успіхи та інсайти минулого тижня.

    Це дає величезну цінність для мого каналу, я бачу весь процес і можу внести корективи. Нещодавно на їхній конференції Waves 25 вони представили Maya by Make – конструктор автоматизацій, з яким можна говорити, і він створює потрібні вам процеси. А також нові ультра-налаштовувані ШІ-агенти.

    Якщо ви – творець контенту, маркетингове агентство чи розробник стартапу, Make – це ваш шлях до операціоналізації ШІ, створення не купи розрізнених додатків, а цілісної, пов’язаної екосистеми. Бонус: Make пропонує моїй спільноті безкоштовний місяць Pro-плану за посиланням: [https://www.make.com/en/register?promo=mattwolfe&utm_source=mattwolfe&utm_medium=influencer&utm_campaign=mattwolfe-integration-nov25]. Перестаньте стрибати між додатками – почніть керувати своїм ШІ-робочим процесом!

    Gemini 3 у дії: Тестування потужності

    Досить теорії. Перейдемо до практики!

    (На екрані з’являється інтерфейс Google AI Studio)

    Перевіримо, чи доступний Gemini 3 в AI Studio. Згідно з анонсом, він має бути тут. Я бачу моделі, і так, Gemini 3 присутній. Хоча я записую це до офіційного запуску і маю доступ через демо-версію Gemini, теоретично, ви повинні його бачити тут.

    Тест 1: Операційний планувальник – чи впорається з календарем?

    Почнімо з задачі, що вимагає логіки та планування. Попросила Gemini 3 зіграти роль мого операційного планувальника:

    “Ти мій операційний планувальник. Мені потрібно опублікувати чотири відео протягом наступних 10 днів. Відео А: спонсор має бути “живий” до 4-го дня. Відео Б: потребує 2 дні монтажу після зйомки. Відео С: не може бути опубліковане на вихідних. Відео D: залежить від публікації відео А. Обмеження: зйомка тільки по понеділках, середах, п’ятницях. Максимум три відео на тиждень. Мінімум один буферний день перед будь-яким спонсорським відео. Створи детальний 10-денний календар з тим, що я роблю щодня, коли знімається та публікується кожне відео, з коротким обґрунтуванням, чому цей розклад відповідає всім обмеженням. Потім запропонуй альтернативний розклад з поясненням компромісів”.

    (Демонстрація відповіді Gemini 3)

    Дивіться! Gemini 3 розбив усе по полицях: розклад зйомок, монтажу, публікацій, обґрунтування. Навіть запропонував альтернативний варіант з компромісами. Тест успішно пройдено! Врахував усі мої вимоги. Круто!

    Тест 2: Головоломка з ймовірностями – чи зможе ШІ “подумати” про математику?

    Ускладнимо завдання. Дамо йому математичну головоломку:

    “Виріши покроково цю головоломку з ймовірностями. Є 5 дверей. За одними – машина, за чотирма – кози. Ти вибираєш одні двері. Ведучий, знаючи, де машина, відкриває два різних двері з козами і пропонує вибір: залишитись з початковими дверима чи перейти до одних з двох зачинених.

    1. Ймовірність виграшу, якщо завжди залишатися.
    2. Ймовірність виграшу, якщо завжди переходити, вибираючи випадково з двох дверей, що залишилися.
    3. Узагальни свої міркування для випадку з N дверима, де ведучий відкриває N-3 кози, а ти вибираєш між тим, щоб залишитись чи перейти до одних з двох дверей, що залишилися. Покажи свою роботу”.

    (Демонстрація відповіді Gemini 3)

    Найцікавіше – “покажи свою роботу”. Gemini 3 це зробив! Він розписав математику, візуалізував її. Виглядає дуже наочно та зрозуміло. Відсотки, сценарії – все на місці. Вражає, як добре він візуалізував процес розрахунку.

    Тест 3: Паперова робота та візуалізація – “Attention Is All You Need”

    Тепер – щось справді захопливе! Один з найважливіших паперів в історії ШІ – “Attention Is All You Need”, який представив архітектуру Transformer, основу більшості сучасних LLM. Попросила Gemini 3:

    “Перейди за цим URL (URL паперу).

    1. Підсумуй основну ідею паперу у 10 пунктах для нетехнічної аудиторії.
    2. Перетвори ці 10 пунктів на 2-хвилинний скрипт для YouTube відео.
    3. Створи просту анімаційну візуалізацію за допомогою HTML, CSS, SVG, яка пояснює механізм уваги (attention) для початківців. Надай повний HTML, CSS, SVG код”.

    (Демонстрація відповіді Gemini 3)

    Перші два пункти – стандарт для багатьох LLM: підсумувати та написати скрипт. Справився чудово. Але третій пункт – це щось! Gemini 3 надав SELF-CONTAINED HTML файл, який я могла просто зберегти та відкрити в браузері.

    І коли я відкрила цей код у браузері, побачила це:

    (Демонстрація візуалізації механізму уваги)

    Це неймовірно! Візуалізація механізму уваги, що пояснює, як модель розуміє зв’язок слів у реченні, наприклад, “it” стосується “animal”. Кольорові лінії, зрозумілі пояснення, головне – все це створено на основі складного наукового паперу. Це не просто код, це перетворення складної концепції у доступний візуальний формат. Я вражена!

    Тест 4: З хаосу – до історії та візуалізації

    Що, якби дати йому купу розрізнених нотаток і попросити зробити з них YouTube відео?

    “Ось блок хаотичних, неструктурованих нотаток: “ШІ-моделі стають більшими щороку. Збільшується споживання енергії. Нові чіпи від Nvidia, AMD, Google. Дебати про open source проти closed source.” (і так далі).

    Перетвори це на чітку наративну структуру з трьох актів для YouTube відео. Створи сторіборд з 8 кадрів, кожен з візуальним описом. Створи просту анімацію motion graphics за допомогою HTML/CSS keyframes для відкриття відео”.

    (Демонстрація відповіді Gemini 3)

    Він створив структуру з трьох актів, сторіборд з візуальними описами та навіть HTML/CSS код для анімації. Я відкрила її в Canvas – і ось, централізована/децентралізована анімація. Вона не ідеальна, але для третього кроку в багатоетапному завданні – це просто фантастика!

    Тест 5: Створюємо гру з нуля – Minecraft-Style!

    А тепер – справжня “важка артилерія”. Можна створити цілий світ?

    “Побудуй мінімалістичний воксельний світ у стилі Minecraft, використовуючи лише HTML, CSS та JavaScript. Без зовнішніх бібліотек. Вимоги: 2D або псевдо-3D сітка блоків, якими гравець може пересуватися. Керування клавіатурою. Можливість ставити та видаляти блоки. Простий ефект освітлення/тіні. Весь код має запускатись одразу в браузері. Після написання коду поясни архітектуру та як файли поєднуються”.

    (Демонстрація створення та гри)

    Я в шоці! Не тільки створив архітектуру, а й згенерував код, який запустився! Я можу пересуватися (хоч і не відразу – довелося поставити блок, щоб “розбудити” керування ), ставити та видаляти блоки. Це майже Minecraft! Без жодної бібліотеки. Просто неймовірно.

    Тест 6: Гра-стратегія – змагання з ШІ

    Що, якби попросити його створити цілу гру-стратегію, натхненну Advanced Wars?

    “Створи просту покрокову стратегічну гру, натхненну Advanced Wars, лише за допомогою HTML, CSS та JavaScript. Вимоги: сітка 10×10. Два гравці (червоний і синій), два типи юнітів (піхота – 2 клітинки, танк – 3 клітинки, вища атака). Кожен юніт має HP та атаку. Клацанням вибираємо юніт, потім клікаємо на клітинку для переміщення чи атаки. Дуже простий ШІ для опонента: на своєму ходу він має переміщувати кожен юніт до найближчого ворога та атакувати, якщо в зоні досяжності. Без зовнішніх бібліотек”.

    (Демонстрація гри)

    Ось “міні-війни”! Я можу переміщувати свої війська, а ШІ опонента теж рухається! Спочатку я не зрозуміла, як атакувати, але треба переміститися впритул до ворога. Це працює! Невеликі недоліки, але створити таку гру з одного запиту – фурор!

    Тест 7: Vampire Survivors – оживляємо гру

    Авторка статті вже пробувала це в минулому, але цікаво, як Gemini 3 впорається зараз. “Створи клон Vampire Survivors, який працює в браузері за допомогою Canvas”.

    (Демонстрація гри Vampire Survivors)

    Він зробив це! Виглядає як оригінал! Я можу збирати досвід, прокачувати зброю. Гра надзвичайно швидка, я досягла 25 рівня за кілька секунд! Але автор попросила його виправити, давши фідбек.

    (Демонстрація виправленої версії)

    Модель виправилась! Гра стала збалансованішою, хоча швидкість все одно наростає. Це майже ідеальний клон.

    Тест 8: Музика з ШІ – “Happy Birthday” і не тільки

    Що, якби попросити ШІ написати музику?

    “Напиши пісню “Happy Birthday”, і зроби так, щоб її можна було відтворити в браузері”.

    (Демонстрація пісні “Happy Birthday”)

    Я ввела ім’я “Gemini”. І це не просто аудіо! З’явилися анімації: кульки, конфетті, караоке-текст. Все це з’явилося само собою, без моїх додаткових прохань. Я вражена.

    А що, якби попросити щось унікальне? “Створи повністю оригінальну пісню і зроби так, щоб її можна було відтворити в браузері”.

    (Демонстрація оригінальної пісні)

    Ось це так! Пісня з текстом “Stars are glitching in the sky…”, а я маю співати разом з нею. І знову – візуалізатор, кнопки play/stop, кольорова схема – все це з’явилося само. Gemini 3 використав Tone.js для генерації аудіо в реальному часі. Це вражає.

    Gemini Agent: Коли ШІ стає вашим персональним помічником

    Ми вже трохи торкнулися Gemini Agent, але тепер зануримося глибше.

    Тест 9: Агент з досліджень – новини ШІ за тиждень

    “Досліди три найважливіші анонси ШІ за останні 7 днів. Для кожного: 3-реченнєве резюме, посилання на першоджерело, один потенційний недолік або критика. Потім перетвори це на 10 пунктів для YouTube-новин та напиши короткий вступ і висновок для відео”.

    (Демонстрація роботи агента)

    Я бачу, як агент обробляє завдання, робить власні пошуки в Google, аналізує, перевіряє факти. Він навіть дослідив існування GPT 5.1! І ось результат: три новини, резюме, посилання, критика. А потім – готова структура для YouTube-шоу з інтро та аутро. Фантастично!

    Тест 10: Агент як виконавчий помічник

    “Дій як мій виконавчий помічник. Переглянь мої майбутні події в календарі на 3 дні. Перевір останні листи на наявність завдань або дедлайнів. Об’єднай це в єдину панель з топ-3 пріоритетами на сьогодні, пропозиціями щодо тайм-блокінгу та списком речей, від яких варто відмовитись або делегувати, у форматі простої панелі, яку можна скопіювати в документ”.

    (Демонстрація результату)

    Невелика проблема: я використовую не свій основний Google-акаунт, тому календар і листи порожні. Але система навіть так видала мені топ-пріоритети (які я, звісно, заблюрю!) і пропозиції щодо тайм-блокінгу. Якби це був мій реальний акаунт, було б неймовірно корисно.

    Тест 11: Бронювання ресторану – ШІ за браузером!

    Найцікавіше! Чи зможе агент забронювати столик?

    “Забронюй вечерю для двох на цю п’ятницю приблизно о 19:30. Знайди італійський ресторан у Сан-Франциско з добрими відгуками та доступними місцями на вулиці”.

    (Демонстрація браузера та бронювання)

    Ось воно! Відкривається браузер (це хмарний браузер, а не мій власний), і ШІ починає шукати. Він переходить на OpenTable, шукає ресторани, фільтрує за доступністю. Я бачу його “думки” – чому він приймає ті чи інші рішення. Тут ШІ дійсно діє самостійно. Він не зміг завершити бронювання, бо я не була залогінена у системі бронювання, але він довів мене до моменту, де я сама можу це зробити. І я можу переглянути скріншоти кожного кроку, який він зробив! Це вражає!

    Фінальні роздуми: Gemini 3 – король чи претендент?

    Я просто шокована тим, що робить Gemini 3. Особливо коли йому вдається створювати графіку, відео, ігри, в які можна грати, з одного запиту. Порівняно з тим, де ми були рік чи два роки тому – це просто космос!

    Google, на мою думку, робить неймовірно щедру справу, надаючи доступ до AI Studio, де можна безкоштовно тестувати ці потужні моделі. І тепер у них є найкраща модель на ринку, принаймні, згідно з бенчмарками та моїми тестами. Gemini 3 – це вражаюче, і він уже доступний.

    Я лише подряпала поверхню його можливостей. Буду експериментувати з API, розширюючи межі. Але я впевнена, що ми ще багато почуємо про Gemini 3 протягом наступних тижнів, коли люди зрозуміють, наскільки він потужний.

    Це справді круто. А тепер, сподіваюся, ви теж вражені, і я хочу закликати вас до дії.

    Що далі?

    1. Спробуйте самі: Якщо у вас є доступ до Google AI Pro чи Ultra, або просто грайтеся в AI Studio. Ви не повірите, на що здатна ця модель.
    2. Експериментуйте: Не бійтеся ставити складні, багатоетапні запити. Саме там розкривається справжня потужність Gemini 3.
    3. Слідкуйте за новинами: ШІ розвивається шаленими темпами. Підписуйтесь на канали, читайте статті, щоб бути в курсі.

    Підсумовуючи, Gemini 3 – це не просто чергове оновлення. Це серйозний конкурент, який встановлює новий стандарт. Він демонструє, як швидко штучний інтелект еволюціонує від простого виконавця до “помічника-суперзірки”, здатної вчитися, творити та діяти.

    Я неймовірно вдячна Google за ранній доступ до цієї потужності. Це було справжнє занурення у майбутнє.

    І пам’ятайте: поки ви тут, я щодня вивчаю нові інструменти та новини ШІ, щоб ви першими дізнавалися про найцікавіше. Тож, якщо вам сподобалося це відео, ставте лайк, підписуйтесь на канал і натисніть на дзвіночок, щоб не пропустити наступні пригоди у світі штучного інтелекту!

    Дякую, що були зі мною, досліджували разом. До зустрічі в наступному відео! Бувайте!

    Поділитися.
    0 0 голоси
    Рейтинг статті
    Підписатися
    Сповістити про
    guest
    0 Коментарі
    Найстаріші
    Найновіше Найбільше голосів
    Зворотній зв'язок в режимі реального часу
    Переглянути всі коментарі
    0
    Буду рада вашим думкам, прокоментуйте.x