Тиждень у Всесвіті Штучного Інтелекту: Історії з Краю Епохи
Привіт, друзі! З вами Ліла Гарт, і я сьогодні не з гарячою кавою (хоча, зізнаюся, вона поруч), а з насиченим тижнем у бурхливому світі штучного інтелекту. Повірте, останні події нагадали мені музичну шкатулку – чим далі, тим більше мелодій, і кожна з них, як тоненька ниточка, плете тканину нашого майбутнього.
Отже, влаштовуйтеся зручніше, адже я проведу вас через яскраві моменти цього тижня, де технології зустрічаються з творчістю, а людський досвід стає полотном для інновацій.
#MetaLlamaCon: Нова ера розмов
Почнемо з Meta, адже вони влаштували свою першу Llamacon. Зазвичай, всі найсвіжіші новини з AI вони презентують на щорічному Meta Connect. Але, цього разу, вони бачите, вирішили влаштувати окремий захід, присвячений виключно штучному інтелекту. І що з цього вийшло хоча значить, Нова версія програми Meta AI! Якщо у вас є окуляри Ray-Ban Meta, ви вже. Знаєте цю програму – раніше вона називалась Meta View. Тепер же, вона перетворилась на Meta AI app, яка має вбудований чат з моделлю Llama. Це, мабуть, їх відповідь на ChatGPT, Claude та інших конкурентів. Тож, дивіться, відкриваєте програму і починаєте розмову з Llama.
Цікаво, що сама Llama відповідає жіночим голосом і на питання про те, яку модель вона використовує, відповідає, що побудована на Llama 4. Це як знайомство з новим другом, який завжди чемно відповість та навіть розважить жартом.
Але найцікавіше знаєте, – це інтеграція з соціальною мережею. Ви можете поділитися своїми розмовами з AI, як звичайним постом у Facebook чи Instagram. Люди зможуть коментувати, ну, ставити лайки і навіть взагалі, черпати натхнення з чужих діалогів, якось так. Програма використовує генератор зображень від Meta – Emu AI. Дивно, чи бачите, не чудовий спосіб для нескінченної творчості?
Ще один цікавий взагалі, момент – ви можете почати розмову через окуляри Ray-Ban. Meta, потім дістати телефон і продовжити її в додатку, або навіть у веб-версії. Більше того, зручно, правда?
Але, як завжди, є й зворотна сторона медалі. Meta внесла зміни до своєї політики конфіденційності стосовно окулярів. Тепер, коли ви використовуєте Meta AI з камерою, вона завжди увімкнена, якщо ви самі не вимкнете її. Фото та відео з окулярів зберігаються у вашій галереї, а не використовується Meta для навчання (на щастя). Але аудіозаписи ваших розмов розумієте, зберігатимуться в хмарі, і ви не зможете відключити їхнє збереження. Хоча, у дивіться, вас завжди є можливість видалити їх. Все це робиться для покращення їхніх великих мовних моделей.
Звісно, новинка – реклама. Далі, згідно з інформацією від The Verge, в Meta AI будуть додані рекламні оголошення. Спочатку їх не було, але Марк Цукерберг вже заявив про плани інтегрувати товарні рекомендації. Безумовно, варіанти можуть бути різні: від простих рекламних блоків у начебто, знаєте, стрічці до рекомендацій товарів безпосередньо у відповідях чат-бота, приблизно так. Все заради покращення досвіду користувачів, звісно.
Google: Світ, що реагує
Google теж не дрімає. Насамперед, вони порадували нас новими фішками в AI-режимі. Функція, дуже схожа на Perplexity та ChatGPT у пошуку, вже доступна для користувачів Labs у США. Якщо ви там, то уявіть собі, швидше перевіряйте – можливо, ви вже маєте доступ. Дивлячись на відео, де користувач набирає запит про найкращі вінтажні магазини. Бачимо чат-бот, що видає відповіді з посиланнями на сайти та картою. Дуже інтуїтивно та зручно.
Крім цього, найближчими тижнями, AI-режим з’явиться у невеликої частини користувачів у США, навіть поза межами Labs. Отже, незабаром і ми зможемо насолодитися цією функцією.
Що ще? Якщо у вас є Gemini app на телефоні, ви зможете редагувати зображення. Звичайно, додавання сонцезахисних окулярів, капелюхів – це звичні речі. Але тепер це все доступно прямо в додатку.
А ще – підтримка аудіо-оглядів у Notebook LM. Тепер ви можете створювати маленькі подкасти з даних, які ви надаєте, понад 50 мовами! Просто перейдіть у Notebook LM, оберіть джерело (наприклад, квантові. Обчислення), імпортуйте, налаштуйте мову (навіть іспанську), і отримайте свій міні-подкаст.
от,
І, звичайно, Google представили Little Language Lessons, десь так. Це невеличкий додаток для тих, хто не володіє мовою на достатньому рівні, але хоче трохи розуміти її під час подорожей, десь так. Тут є три експерименти: Tiny Lesson (слова, фрази, граматика для різних ситуацій), Slang Hang (ідеоми та сленг) і Word Cam (фото для розпізнавання незнайомих слів навколо). Дуже корисно, погодьтесь. Коли ми збираємось в Японію, в такому дусі.
Recraft: Творчість без меж (та з промокодом! Насправді, )
Не можу не згадати про крутезну платформу Recraft – це. Повноцінний генератор та скажімо, редактор зображень, що з легкістю замінить купу інших інструментів. Їхні фішки: векторизація, генерація макетів, масштабування, видалення фону, AI-стирання, і багато іншого. Вони навіть слухайте, опинилися у верхніх рядках Chatbot Arena!
слухайте,
Але найголовніше – оновлення стилів. У Recraft з’явилася величезна бібліотека стилів, якими так і хочеться скористатися. Від яскравого морського фентезі до ретро-аркад оскільки ви навіть можете створювати власні комбінації стилів. Просто відчуйте себе художником, що експериментує з пензлем, змішуючи різні техніки!
І найприємніше: Recraft дарує $11 знижки на перший місяць використання. Якщо ви давно мріяли про свій візуальний стиль – це ваш шанс. Заходьте, експериментуйте, насолоджуйтесь творчістю!
OpenAI: Балансування особистості та покращення пошуку
Від OpenAI теж прилетіли новини. Насправді, сем наприклад, Альтман поділився, що сучасна версія GPT-4 стала надто вже чемною та лестить. І, диво, вони відкотили оновлення! Тепер GPT-4 знову скажімо, намагається бути корисним, а не просто лестощами. Вони працюють над балансом, враховуючи як короткостроковий, так і довгостроковий досвід користувачів.
покращився пошук у ChatGPT та з’явився більш зручний досвід покупок. Насправді, напишіть “найкраща еспресо-машина до 200 $”, і отримаєте карусель з результатами, як у Google. Круто! Тепер функція в принципі, пошуку є і у WhatsApp. Все для вашої зручності!
Ще одна цікавинка наприклад, – Ілон Маск обіцяє Grok 3. 5 вже наступного тижня для передплатників вищого рівня (той, що $57 на місяць). Щоб було ясно, він стверджує, що ця модель вміє відповідати на технічні питання про ракетні двигуни та електрохімію, і навіть видавати відповіді, яких немає в інтернеті. Чекаємо, сподіваємось. Але, як завжди, тут може бути не все так швидко, як хотілося б. Зрозуміло,
Anthropic: Нові дивіться, можливості Claude
Anthropic анонсували інтеграцію для Claude. Зрозуміло, це – Model Context Protocols (MCPs), що дозволяють. LLMs взаємодіяти з іншими програмами, на кшталт Cursor, Windsurf. Тепер більше офіційних з’єднань доступні в Claude web app, особливо для командних та корпоративних планів. Коли функція з’явиться у дешевшій версії, обов’язково спробуємо!
Alibaba: Гібридне мислення
Alibaba представила Quinn 3 – гібридну модель штучного інтелекту. Її особливість припустимо, у тому, що ви можете вмикати або вимикати так зване “мислення” моделі. Це як з провідником: якщо потрібно швидко, то вимикаємо. Якщо важлива начебто, точність – даємо подумати довше. За результатами тестів, Quinn 3 видає вражаючі показники. Хоча, чесно кажучи, я вже знаєте, трохи втомилася від постійних покращень великих мовних моделей. Для мене важливіше, коли AI взагалі, може творчо генерувати контент, а не бути трохи кращим у кодуванні, приблизно так. Відверто кажучи, все це стає менш захопливим. Фактично,
Versep: AI, що припустимо, бачить ваш екран
На десерт – Versep та їх VI, новий інструмент, що взаємодіє з вашим комп’ютером. Уявіть собі AI, що бачить все так, як ви. Простіше кажучи, він працює на вашому комп’ютері і має доступ до всіх ваших програм і акаунтів. Ви просто описуєте, що хочете зробити, а VI все зробить замість вас. Очевидно, у прикладі, він відкривав Adobe Podcast, видаляв шуми. Або міг би намалювати щось в Figma оскільки
Звісно, поки що це чекає. Але перспективи вражають. По суті, ви можете вчитися працювати з програмами разом з AI, спостерігаючи за його діями. Зрозуміло,
Творчий AI: Нове дихання
А тепер трохи про те, що дійсно надихає.
- Midjourney: уявіть собі, Вони додали Omni Reference – ви можете. Використати себе, чи якийсь предмет, як основний елемент у вашому зображенні.
- Cling AI: Миттєвий ефект плівки! Завантажуєте портрет, і отримуєте анімовану фотографію в стилі Polaroid.
- Higsfield AI: Iconic Scenes – переносьте себе у сцени з відомих фільмів! Чесно кажучи,
- Krea: GPT Paint дозволяє малювати прямо на фотографії. Прямо як у GPT-4, але у вашому улюбленому ресурсі.
- ChatGPT-4: Ось що робить ефект тих змін. Щось невловиме, що через 70 ітерацій перетворює фото на зовсім інше.
Коротко про все:
- Suno: Покращили версію 4. Тобто, 5 – якісніше, більше музики, якось так.
- Duolingo: Стає AI-first компанією, фокусуючись на ідеях, а не рутинних задачах.
- Lyft: AI приблизно, допомагає водіям оптимізувати маршрут.
- Aurora: Безпілотні вантажівки в Техасі, проїхали 1200 миль без водія.
Ось така вона, моя картина тижня. Зараз мені все більше подобається дивитися на творчий бік AI, типу того. Там, де відео, зображення, музика стають все краще і краще.
До наступної зустрічі! Разом ми змінимо світ!







