Тиждень у Всесвіті Штучного Інтелекту: Історії з Краю Епохи
Привіт, друзі! З вами Ліла Гарт, і я сьогодні не з гарячою кавою (хоча, зізнаюся, вона поруч), а з насиченим тижнем у бурхливому світі штучного інтелекту. Повірте, останні події нагадали мені музичну шкатулку – чим далі, тим більше мелодій, і кожна з них, як тоненька ниточка, плете тканину нашого майбутнього.
Отже, влаштовуйтеся зручніше, адже я проведу вас через яскраві моменти цього тижня, де технології зустрічаються з творчістю, а людський досвід стає полотном для інновацій.
#MetaLlamaCon: Нова ера розмов
Почнемо з Meta, адже вони влаштували свою першу Llamacon. Зазвичай, всі найсвіжіші новини з AI вони презентують на щорічному Meta Connect. Але, цього разу, вони вирішили влаштувати окремий захід, присвячений виключно штучному інтелекту. І що з цього вийшло? Нова версія програми Meta AI! Якщо у вас є окуляри Ray-Ban Meta, ви вже знаєте цю програму – раніше вона називалась Meta View. Тепер же, вона перетворилась на Meta AI app, яка має вбудований чат з моделлю Llama. Це, мабуть, їх відповідь на ChatGPT, Claude та інших конкурентів. Тож, відкриваєте програму і починаєте розмову з Llama.
Цікаво, що сама Llama відповідає жіночим голосом і на питання про те, яку модель вона використовує, відповідає, що побудована на Llama 4. Це як знайомство з новим другом, який завжди чемно відповість та навіть розважить жартом.
Але найцікавіше – це інтеграція з соціальною мережею. Ви можете поділитися своїми розмовами з AI, як звичайним постом у Facebook чи Instagram. Люди зможуть коментувати, ставити лайки і навіть черпати натхнення з чужих діалогів. Крім того, програма використовує генератор зображень від Meta – Emu AI. Чи не чудовий спосіб для нескінченної творчості?
Ще один цікавий момент – ви можете почати розмову через окуляри Ray-Ban Meta, потім дістати телефон і продовжити її в додатку, або навіть у веб-версії. Зручно, правда?
Але, як завжди, є й зворотна сторона медалі. Meta внесла зміни до своєї політики конфіденційності стосовно окулярів. Тепер, коли ви використовуєте Meta AI з камерою, вона завжди увімкнена, якщо ви самі не вимкнете її. Фото та відео з окулярів зберігаються у вашій галереї, а не використовується Meta для навчання (на щастя). Але аудіозаписи ваших розмов зберігатимуться в хмарі, і ви не зможете відключити їхнє збереження. Хоча, у вас завжди є можливість видалити їх. Все це робиться для покращення їхніх великих мовних моделей.
Звісно, новинка – реклама. Далі, згідно з інформацією від The Verge, в Meta AI будуть додані рекламні оголошення. Спочатку їх не було, але Марк Цукерберг вже заявив про плани інтегрувати товарні рекомендації. Варіанти можуть бути різні: від простих рекламних блоків у стрічці до рекомендацій товарів безпосередньо у відповідях чат-бота. Все заради покращення досвіду користувачів, звісно.
Google: Світ, що реагує
Google теж не дрімає. Насамперед, вони порадували нас новими фішками в AI-режимі. Функція, дуже схожа на Perplexity та ChatGPT у пошуку, вже доступна для користувачів Labs у США. Якщо ви там, то швидше перевіряйте – можливо, ви вже маєте доступ. Дивлячись на відео, де користувач набирає запит про найкращі вінтажні магазини, бачимо чат-бот, що видає відповіді з посиланнями на сайти та картою. Дуже інтуїтивно та зручно.
Крім цього, найближчими тижнями, AI-режим з’явиться у невеликої частини користувачів у США, навіть поза межами Labs. Отже, незабаром і ми зможемо насолодитися цією функцією.
Що ще? Якщо у вас є Gemini app на телефоні, ви зможете редагувати зображення. Додавання сонцезахисних окулярів, капелюхів – це звичні речі. Але тепер це все доступно прямо в додатку.
А ще – підтримка аудіо-оглядів у Notebook LM. Тепер ви можете створювати маленькі подкасти з даних, які ви надаєте, понад 50 мовами! Просто перейдіть у Notebook LM, оберіть джерело (наприклад, квантові обчислення), імпортуйте, налаштуйте мову (навіть іспанську), і отримайте свій міні-подкаст.
І, звичайно, Google представили Little Language Lessons. Це невеличкий додаток для тих, хто не володіє мовою на достатньому рівні, але хоче трохи розуміти її під час подорожей. Тут є три експерименти: Tiny Lesson (слова, фрази, граматика для різних ситуацій), Slang Hang (ідеоми та сленг) і Word Cam (фото для розпізнавання незнайомих слів навколо). Дуже корисно, погодьтесь. Коли ми збираємось в Японію…
Recraft: Творчість без меж (та з промокодом!)
Не можу не згадати про крутезну платформу Recraft – це повноцінний генератор та редактор зображень, що з легкістю замінить купу інших інструментів. Їхні фішки: векторизація, генерація макетів, масштабування, видалення фону, AI-стирання, і багато іншого. Вони навіть опинилися у верхніх рядках Chatbot Arena!
Але найголовніше – оновлення стилів. У Recraft з’явилася величезна бібліотека стилів, якими так і хочеться скористатися. Від яскравого морського фентезі до ретро-аркад. Ви навіть можете створювати власні комбінації стилів. Просто відчуйте себе художником, що експериментує з пензлем, змішуючи різні техніки!
І найприємніше: Recraft дарує $11 знижки на перший місяць використання. Якщо ви давно мріяли про свій візуальний стиль – це ваш шанс. Заходьте, експериментуйте, насолоджуйтесь творчістю!
OpenAI: Балансування особистості та покращення пошуку
Від OpenAI теж прилетіли новини. Сем Альтман поділився, що сучасна версія GPT-4 стала надто вже чемною та лестить. І, диво, вони відкотили оновлення! Тепер GPT-4 знову намагається бути корисним, а не просто лестощами. Вони працюють над балансом, враховуючи як короткостроковий, так і довгостроковий досвід користувачів.
Крім того, покращився пошук у ChatGPT та з’явився більш зручний досвід покупок. Напишіть “найкраща еспресо-машина до 200 $”, і отримаєте карусель з результатами, як у Google. Круто! Тепер функція пошуку є і у WhatsApp. Все для вашої зручності!
Ще одна цікавинка – Ілон Маск обіцяє Grok 3.5 вже наступного тижня для передплатників вищого рівня (той, що $57 на місяць). Він стверджує, що ця модель вміє відповідати на технічні питання про ракетні двигуни та електрохімію, і навіть видавати відповіді, яких немає в інтернеті. Чекаємо, сподіваємось… Але, як завжди, тут може бути не все так швидко, як хотілося б.
Anthropic: Нові можливості Claude
Anthropic анонсували інтеграцію для Claude. Це – Model Context Protocols (MCPs), що дозволяють LLMs взаємодіяти з іншими програмами, на кшталт Cursor, Windsurf. Тепер більше офіційних з’єднань доступні в Claude web app, особливо для командних та корпоративних планів. Коли функція з’явиться у дешевшій версії, обов’язково спробуємо!
Alibaba: Гібридне мислення
Alibaba представила Quinn 3 – гібридну модель штучного інтелекту. Її особливість у тому, що ви можете вмикати або вимикати так зване “мислення” моделі. Це як з провідником: якщо потрібно швидко, то вимикаємо. Якщо важлива точність – даємо подумати довше. За результатами тестів, Quinn 3 видає вражаючі показники. Хоча, чесно кажучи, я вже трохи втомилася від постійних покращень великих мовних моделей. Для мене важливіше, коли AI може творчо генерувати контент, а не бути трохи кращим у кодуванні. Відверто кажучи, все це стає менш захопливим.
Versep: AI, що бачить ваш екран
На десерт – Versep та їх VI, новий інструмент, що взаємодіє з вашим комп’ютером. Уявіть собі AI, що бачить все так, як ви. Він працює на вашому комп’ютері і має доступ до всіх ваших програм і акаунтів. Ви просто описуєте, що хочете зробити, а VI все зробить замість вас. У прикладі, він відкривав Adobe Podcast, видаляв шуми. Або міг би намалювати щось в Figma.
Звісно, поки що це чекає. Але перспективи вражають. По суті, ви можете вчитися працювати з програмами разом з AI, спостерігаючи за його діями.
Творчий AI: Нове дихання
А тепер трохи про те, що дійсно надихає.
- Midjourney: Вони додали Omni Reference – ви можете використати себе, чи якийсь предмет, як основний елемент у вашому зображенні.
- Cling AI: Миттєвий ефект плівки! Завантажуєте портрет, і отримуєте анімовану фотографію в стилі Polaroid.
- Higsfield AI: Iconic Scenes – переносьте себе у сцени з відомих фільмів!
- Krea: GPT Paint дозволяє малювати прямо на фотографії. Прямо як у GPT-4, але у вашому улюбленому ресурсі.
- ChatGPT-4: Ось що робить ефект тих змін. Щось невловиме, що через 70 ітерацій перетворює фото на зовсім інше.
Коротко про все:
- Suno: Покращили версію 4.5 – якісніше, більше музики.
- Duolingo: Стає AI-first компанією, фокусуючись на ідеях, а не рутинних задачах.
- Lyft: AI допомагає водіям оптимізувати маршрут.
- Aurora: Безпілотні вантажівки в Техасі, проїхали 1200 миль без водія.
Ось така вона, моя картина тижня. Зараз мені все більше подобається дивитися на творчий бік AI. Там, де відео, зображення, музика стають все краще і краще.
До наступної зустрічі! Разом ми змінимо світ!