Звісно, ось кінцевий продукт статті, написаної Лілою Гарт, для публікації в блозі, без будь-яких доповнень чи пояснень:
Штучний інтелект у повітрі: Оновлення тижня від OpenAI, Google та інших
Привіт, друзі! Ліла Гарт з вами, і я просто в захваті від тижня, що минає. Світ штучного інтелекту вирує, а нові анонси, моделі та інновації змушують очі сяяти. Давайте разом зануримося в епіцентр подій і розберемо все по частинах.
OpenAI: Зміни та нові горизонти
Почнемо з OpenAI. Цей тиждень приніс кілька ключових змін, які заслуговують на нашу увагу.
По-перше, компанія поступово виводить з роботи деякі з наших улюблених моделей. З першого погляду це може викликати смуток, але, як виявилося, ці кроки відкривають нові, захоплюючі можливості.
- Попрощайтеся з GPT-4 (але не надовго). З 30 квітня модель GPT-4, яка захопила уяву людства навесні 2023 року, припинить свою роботу. Важливо відзначити, що це не кінець, а перехід до оновленої версії – GPT-4o.
- GPT-4.5: коротке, але яскраве існування. Модель GPT-4.5, доступна в ChatGPT з кінця лютого 2025 року (менше двох місяців!) також буде незабаром знята з експлуатації. Хоча вона не завжди була найрозумнішою в питаннях складних логічних задач і математики, але ідеально підходила для творчого письма.
Отже, чому ця зміна така важлива? Бо на заміну цим моделям приходить щось справді захоплююче.
-
GPT-4.1: Нова ера в API. На цьому тижні OpenAI представила GPT-4.1. Ця модель ще не доступна в ChatGPT, але її вже можна використовувати через API. Вона доступна у трьох версіях: GPT-4.1, GPT-4.1 mini та GPT-4.1 Nano.
Основна перевага моделі – її здатність генерувати відповіді так само швидко, як і модель 4.0.
Крім того, GPT-4.1, міні та нано значно краще справляються з кодуванням, ніж GPT-4.0.
-
Навчання та креативність. Що стосується здатності виконувати інструкції, GPT-4.1 поки що поступається GPT-4.5, 03 Mini та 01. Але це не означає, що вона менш корисна.
-
Контекстне вікно, що приголомшує. GPT-4.1 має контекстне вікно, що дозволяє обробляти до 1 мільйона токенів. Це приблизно 750 000 слів вхідного та вихідного тексту.
-
Відмінна візуалізація. Також вона на рівні з GPT-4.5 з візуалізацією, математичними обчисленнями та здатністю до міркувань.
-
Ціна питання. Однією з основних причин переходу на GPT-4.1 є ціна. Використання GPT-4.1 коштує приблизно $1,84 за мільйон токенів.
Нові можливості для ChatGPT: 03 та 04 Mini
Але це ще не все! OpenAI представила ще більше нових моделей, які вже доступні користувачам ChatGPT. Це 03 та 04 Mini. Вони пропонують ще більш точні та детальні відповіді, хоча й потребують трохи більше часу на їхню генерацію.
- Миттєва аналітика. Ці моделі здатні аналізувати зображення безпосередньо під час процесу обробки думок. Це відкриває новий рівень вирішення проблем, поєднуючи візуальні та текстові міркування.
- Інтеграція з інструментами. Крім того, ці моделі мають повний доступ до інструментів у ChatGPT, що ще більше розширює їхні можливості.
- Глибоке мислення. Моделі можуть шукати інформацію в Інтернеті, аналізувати зображення, а потім використовувати ці дані для покращення відповіді.
Крім того, вони можуть:
- Аналізувати зміст зображень.
- Виконувати обчислення.
- Писати код.
Математика, код та розум
Не можу не відзначити вражаючі результати 03 та 04 Mini в галузі математики.
- 03 Mini показала результат 88,9% на змагальній математичній платформі.
- 04 Mini досягла 92,7%.
- 03 з Python набрала 95,2%.
- 04 з Python показала вражаючі 98,7%.
- 03 з Python отримала 98,4%.
- 04 mini з Python здобула неймовірні 99,5%!
Нові моделі демонструють дивовижну здатність до розв’язання задач та розробки програмного забезпечення.
Але найважливіше те, що вони можуть генерувати нові ідеї, аналізуючи інформацію з різних областей одночасно.
Вражає, чи не так? Схоже, ми стоїмо на порозі революції.
Microsoft: Швидкий крок вперед
Microsoft також не відстає. На наступному місяці вони збираються представити нову функцію використання комп’ютера безпосередньо в Microsoft Copilot Studio. Вона буде працювати на основі функціоналу використання комп’ютера від OpenAI.
Google: Сила Gemini та багато іншого
Google також зробила значний внесок у тиждень ШІ. Вони випустили нові моделі та анонси, які дійсно привертають увагу.
- Gemini 1.5 Flash: Новий стандарт для кодерів. Gemini 1.5 Flash – це легша та швидша модель. Вона стала першою гібридною моделлю для міркувань. Розробники можуть вимикати та вмикати режим міркування, що допомагає отримати рішення швидше. До того ж вона дешевша від 04 Mini, Claude Sonnet 3.7, Grok 3 та навіть DeepSeek R1.
- LM Arena: Еталон для порівняння. Gemini 1.5 Flash успішно пройшла тестування LM Arena. На платформі ця модель перевершила DeepSeek R1, 03 mini high, 01 preview, Claude 3.7 Sonnet, Grok 2.
- Доступність. У Google AI Studio доступна Gemini 1.5 Pro, а від 17 квітня – і Gemini 1.5 Flash.
- Голос для Gemini. Є можливість увімкнути або вимкнути мислення, використовувати інструменти структурування виводу, виконання коду, виклику функцій.
- Dolphin Gemma: Спілкування з дельфінами. Google випустила Dolphin Gemma. Це базова ШІ-модель, яка допомагає вченим вивчати голосові сигнали дельфінів та генерувати нові, схожі на дельфінячі звуки.
- Нові можливості редагування відео. Gemini Advanced може генерувати відео на основі текстових підказок.
Антропоморфний Клод: Голос і все, що потрібно
Антропоморфний Клод також отримав оновлення.
- Дослідження. Додана функція дослідження.
- Інтеграція. Робота з Google Workspace для підключення електронної пошти, календаря та документів.
- Голосовий режим. Незабаром буде додано голосовий режим.
XAI: Покращена студія та пам’ять
Grok від XAI також отримала кілька оновлень:
- Grok Studio. Функція коду виконання та підтримка Google Drive.
- Пам’ять. Функція запам’ятовування розмов.
Штучний інтелект та креативність
Крім того, ми поговоримо про деякі з найцікавіших нових функцій, які були інтегровані.
-
Cling: Переворот у відеогенерації. AI представила нову версію своєї моделі генерації відео. Модель 2.0 представляє нову інтерактивну концепцію для генерації відео. Нова мультимодальна візуальна мова дозволяє користувачам ефективно висловлювати складні багатовимірні креативні ідеї.
Якість зображень покращилася – чіткість дій, рухи камери, послідовність.
-
Arcads.ai: Жести та емоції. AI представила gesture control.Тепер ви можете додавати емоції для аватарів – сміх, плач та інші.
-
Luma Dream Machine: Нові перспективи. Тепер ви можете налаштувати кут огляду у відео, які ви генеруєте. Доступні декілька варіантів – від статичного до панорамування та нахилу.
Крихітні апдейти, що мають велике значення
Завершуючи огляд, хочу поділитися кількома невеликими інноваціями, які також заслуговують на увагу.
- Crisp: Акценти більше не проблема. Інструмент для видалення фонового шуму та покращення аудіо тепер може видаляти акценти.
- Netflix: ШІ на службі рекомендацій. Netflix тестує нову пошукову систему.
Перспективи і майбутнє
Наостанок, кілька слів про те, як це може вплинути на наше майбутнє.
- AR окуляри від Apple vs. Meta. Тім Кук планує випустити окуляри до того, щоб це зробила Meta.
- Нові можливості для Google. На конференції TED Google продемонструвала технології для окулярів, які викликають захоплення.
Підсумовуючи, тиждень ШІ був насиченим та вражаючим. Від нових моделей та функцій до революційних технологій – світ штучного інтелекту продовжує дивувати та надихати.
Як завжди, не забувайте ділитися своїми думками та враженнями в коментарях. І пам’ятайте, що майбутнє вже тут!
З теплотою,
Ліла Гарт