ШІ, що думає за вас: огляд ChatGPT Pulse та дивовижні новинки!

    Відчуваєте, як технології стрімко розвиваються? Я минулого тижня саме це й відчув. Спокійно пив собі каву, проглядав новини про штучний інтелект і раптом – прорив! Від OpenAI, знайомих нам із ChatGPT. Що нового? Вони випустили ChatGPT Pulse. Це, без перебільшення, революція. Знаю, ви подумали: “Ну ось, ще один ШІ”. Але повірте, все по-іншому.

    Раніше спілкування із цим інтелектом виглядало так: я запитую – він відповідає. Все. А зараз? Зараз він буде думати за нас. Уявляєте? Як улюблена бабуся, яка знає, чого ви хочете, ще до того, як ви самі це усвідомили. ChatGPT Pulse обіцяє аналізувати ваші попередні розмови, інформацію, якій ви довіряєте, і вночі, поки ви спите, формувати для вас персональний список тем, які можуть зацікавити. Наче маєте особистого асистента, який не просто виконує команди, а передбачає ваші бажання. Звучить як фантастика? Але це – реальність.

    Звісно, я не зміг пройти повз. Зайшов у свій ChatGPT, і ось воно! Мій “Pulse” на сьогодні: “Nvidias massive 10 gigawatt alliance” [Альянс Nvidia на 10 гігават], “Clean GPU data center overlay” [Налаштування чистого GPU дата-центру], та “AI agents trading without human oversight” [Торгівля AI агентами без контролю людини]. Цікаво. Особливо перші два пункти, адже коли йдеться про NVIDIA та гігавати, завжди йдеться про щось масштабне. А як воно працює? Він каже: “Hi Matt, I’m here to surface what’s helpful to you.” [Привіт, Метте, я тут, щоб показати тобі корисне]. І пропонує доступ до моїх листів та календаря, щоб “get insights from your emails and calendar” [отримати інформацію з електронної пошти та календаря]. Цікаво, чи не так? Можна також вручну додати цікаві теми. Це справді круто. Нагадує програму Perplexity AI [1], яка теж автоматично підбирає дослідження. Тепер це робить і ChatGPT.

    Найбільше мене здивувало відчуття, ніби ШІ працює в режимі “sleep time compute” [обчислення у час сну], як у їхньому дослідженні [2]. Тобто, поки ми відпочиваємо, він працює, готуючи нам ранковий брифінг. Геніально! Не потрібно чекати, поки ШІ обробить запит – він уже все підготував. Це феноменальна стратегія для максимального використання штучного інтелекту. Але це ще не все. Технічний світ кипить, і сьогодні ми розглянемо ще кілька новинок, які змусять вас по-іншому дивитися на штучний інтелект. Приготуйтеся, буде гаряче!


    Наш цифровий зір: як ШІ вчиться бачити й творити

    Пам’ятаєте, як дивувалися кольоровим фотографіям? А потім – коли комп’ютери почали писати музику? Зараз ми на порозі нової ери, де ШІ не просто аналізує дані, але й творить – зображення, відео, коди. Це вже не далека мрія, а цілком реальні інструменти, що стають доступними все ширше.

    Ось Alibaba знову вражає. Вони, здається, випустили модель Qwen 2.2 Animate. Що це? ШІ оживляє картинку! Ви даєте картинку – а він її оживляє! Бере фотографію, накладає її на відео, синхронізує рухи, міміку, освітлення – і вуаля! Ваше фото стає частиною кіно. Це магія, втілена у алгоритмі, що розпізнає рухи та вирази обличчя, а потім їх відтворює. Наче персонаж з мультфільму оживає та взаємодіє з реальністю. Скільки можливостей для контент-мейкерів, аніматорів та тих, хто хоче розповісти історію візуально!

    Також у них є Qwen 2.5, що генерує відео за текстом. Пишете: “Козак на коні скаче через гірське поле під час заходу сонця”, і він це візуалізує. Це вже не просто картинка, це цілий сюжет! Ми в команді вже спробували ці моделі, і це вражає. Особливо чіткість зображень та реалістичність персонажів. І головне – швидко!

    Але й це ще не все про відео. Kling AI теж випустили свою “Turbo Video Model”. Це вражає. Читаю: “Next Level Creativity Turbocharged. Now at an even lower price” [Новий рівень творчості з Turbocharged. Тепер за нижчою ціною]. І ці відео… Це космос! Бачив космічний корабель, що пролітає крізь чорну діру. Реалістично до неможливості. Аніме-лижник, намальований від руки, але рухається, як справжній. Солдат у повній екіпіровці, з брудом на обличчі, в касці… Деталізація – вражаюча. Ремінь, шолом, навіть краплі поту – усе виглядає максимально реалістично. Це вже не просто “дійсно виглядає”, це “я не можу повірити, що це зробив ШІ”.


    Цікаво знати:

    Раніше створення художніх фільмів вимагало праці сотень людей та коштувало мільйони? Зараз ми бачимо сцени, що народжуються кількома рядками тексту та потужністю ШІ. Це неймовірний прорив!


    Зміни назавжди: ШІ як арт-майстерня та відновлювач минулого

    Гаразд, відео – круто, але що, якщо потрібно трохи змінити картинку? Або є стара, пошкоджена фотографія? І тут з’являється Alibaba з новою моделлю Qwen ImageEdit 2.5509. Вона конкурує з тим, що роблять такі моделі, як Stable Diffusion [3].

    Уявіть: фото жінки та красива сукня. Модель може одягти жінку в сукню, або посадити її в затишне кафе. Головне – зберігається консистентність персонажа. Жінка на кожному зображенні виглядає так само, як на оригіналі. Це як цифровий стиліст, здатний одягнути вас у будь-що, посадити будь-куди – але ви залишитесь собою.

    Або: є оригінальна сумка LV та жінка. Модель зображає жінку з цією сумкою, навіть показує логотип LV. Фантастика для маркетингу, дизайну, реклами. Можна навіть змінювати пози персонажів.

    Найбільше мене вразило відновлення фотографій та кольоризація. Я був вражений, побачивши майже ідеально відновлену пошкоджену, пом’яту фотографію. Єдине, око чоловіка на одній з фотографій дивилося вниз, а не на камеру, після відновлення. Але це дрібниці порівняно з обсягом роботи, який потрібен реставратору. Наскільки це допоможе в збереженні сімейних, історичних архівів!


    Не робіть, як я…

    Намагався вручну відновити фотографію дідуся. Вийшло смішно. ШІ робить це якісно, без моїх “художніх” експериментів.


    Комп’ютерний мозок: ШІ, що пише код, міркує та стає частиною роботів

    Ми вже поговорили про візуальне, але що для тих, хто живе у світі цифр, коду та логіки? Тут також є новинки, що змушують мене здивовано присвистувати.

    Qwen 3 Max – інший рівень. Порівнявши його результати з іншими топовими моделями, я зрозумів: китайські розробники наздогнали та перегнали конкурентів. Він демонструє феноменальні результати в кодуванні, міркуванні, розв’язанні задач. Особливо вражають показники в режимі “heavy mode” з Python – 100 балів! Рівень Google GPT-4 та GPT-5 Pro. Але Qwen 3 Max робить це швидше та ефективніше. Китайські моделі увірвалися на найвищий рівень конкуренції.

    Далі – Kimi Moonshot з “Okay Computer”. Це не просто інструмент, це ціла AI-команда для продукту та інжинірингу. Чат, що обробляє багатосторінкові сайти, мобільні дизайни, створює інтерактивні дашборди з мільйонами рядків даних – все в єдиному агентному режимі. Це як мати в кишені команду розробників, тестувальників та аналітиків. Це серйозно змінює правила гри для стартапів та великих компаній.

    Найцікавіше – те, що робить Google для робототехніки. Їхня модель Gemini Robotics ER1.5 – справжній прорив. Вона розроблена для роботів і дозволяє їм не просто виконувати команди, а й розуміти простір, планувати дії та безпечно взаємодіяти з навколишнім середовищем.

    Уявіть: робот, якому ви кажете “покажи мені миску”, і він її покаже та торкнеться. Це неймовірно для автоматизації заводів, логістики, домашніх помічників. Мене вразила “pointing benchmark” [тести на вказівки] – тобто, коли робот має вказати на певний об’єкт. Gemini Robotics ER1.5 робить це з точністю понад 50%. Він також генерує 2D-точки, визначаючи об’єкти на зображенні. Коли бачиш, як робот-маніпулятор пересуває предмети, і модель їх утримує у фокусі, розумієш – роботи вже незабаром стануть повноцінними членами нашого життя.


    Уряд обирає ШІ: безпека, ефективність та… дешевизна?

    Перейдемо до дещо незвичайного, але дуже важливого. xAI – компанія Ілона Маска – оголосила про розширення доступу до своїх моделей штучного інтелекту для уряду США. Так, ви не помилилися. Урядовці отримають доступ до моделей Grok.

    Що це означає? Федеральні агентства та міністерства США зможуть використовувати ці потужні AI-моделі. Ціна? Всього 42 центи на відділ протягом 18 місяців! Це неймовірна пропозиція. Уряди усвідомлюють потенціал ШІ для оптимізації роботи, покращення безпеки та ефективності. Компанія виділяє команду інженерів для допомоги уряду. Це як “державний підряд” на ШІ, але з дуже привабливими умовами.


    Цікаво знати:

    “42 центи за 18 місяців” – майже жарт. Можливо, це стратегія швидкої інтеграції технологій у державний сектор та отримання реальних даних про їх ефективність.


    “AI Slop”: коли ШІ пише, але звучить… ну, як ШІ

    Тепер – кумедне, але змушує задуматися. Якщо ви використовували ШІ для написання текстів, ви, напевно, стикалися з “AI slop”. Текст звучить… неприродно, ніби його написала не людина. Він може бути багатослівним, з дивним тоном, з повторами…

    Виявляється, люди з Northeastern University знайшли спосіб виявляти цей “AI slop”! Вони проаналізували тексти та знайшли патерни, які відрізняють “людське” письмо від “машинного”. Наприклад, у людських текстах можуть бути слова типу “dribbling” [якщо мова про футбол], або фрази, як-от “Adams media team did not immediately respond to request for comment” [Медіа команда Адамса не відповіла на запит про коментар], що звучать природно. А отт “AI slop” – це коли текст “filled the earth and area that formerly held the puddle” [заповнив землю та ділянку, яка раніше утримувала калюжу] чи “too many words, a little bit wordy around the repaired hydrant, leaving it looking like the city’s smallest ever crime” [забагато слів, трохи багатослівний навколо відремондованого пожежного гідранта, що виглядає як найменший злочин у місті]. Звучить, правда?

    І це класно! Якщо ми можемо виявити цей “slop”, значить, ми можемо покращити. Сподіваюся, це станеться якнайшвидше, адже я люблю експериментувати з ШІ для творчого письма, але іноді видно, що текст написаний машиною. Мрію про час, коли ШІ писатиме настільки природно, що навіть експерт не зможе відрізнити його від людини.


    Світ коду: як Meta намагається навчити ШІ розуміти реальність

    Повернімося до Meta. Я говорив про те, що ШІ має розуміти не лише слова, а й навколишній світ? Команда Meta AI під керівництвом Яна ЛеКуна працює над цим. Вони представили CodeWorld Model – 32-мільярдну модель, яка має на меті дослідити, як “світові моделі” (world models) можуть трансформувати генерацію коду та розуміння його виконання.

    Що це означає? Замість навчання на базі написаного коду, ця модель вчиться, виконуючи код! Як дитина вчиться грати в шахи: робить ходи, бачить результат, розуміє, що працює, а що – ні. CodeWorld Model робить те саме з кодом. Вона генерує код, виконує його, аналізує результат та покращує розуміння.

    Це зовсім інший підхід, ніж у більшості мовних моделей. Ян ЛеКун каже, що лише мовні моделі не призведуть до AGI (штучний загальний інтелект). Потрібне глибше розуміння світу. CodeWorld Model – крок у цьому напрямку. Це відкрита модель, з відкритими вагами, тож кожен може спробувати її дослідити.


    Гігавати для ШІ: як будуються нові “серця” технологічного світу

    Щоб місто жило, потрібна енергія. Великі міста – великі потреби в енергії. Зараз дата-центри для штучного інтелекту – нові “міста”. І їм потрібно неймовірна кількість енергії.

    Кілька місяців тому багато сумнівалися у проєкті “Stargate” – планах OpenAI, Oracle та SoftBank побудувати дата-центри для ШІ. Але, схоже, сумніви розвіялися. Вони оголосили про будівництво п’яти нових майданчиків! Це веде їх до досягнення мети – 500 мільярдів доларів інвестицій у 10 гігават потужності до кінця 2025 року.

    Ключовий майданчик уже розгортається в Техасі, а нові з’являться там само, а також у Нью-Мексико. Очікується, що це створить понад 25 000 робочих місць. Це не просто будівництво серверних кімнат, це побудова інфраструктури світу, де ШІ відіграє центральну роль.

    І ось тут ми підходимо до тієї самої “Nvidias massive 10 gigawatt alliance” [Альянс Nvidia на 10 гігават], про яку згадували на початку. Nvidia вкладає 100 мільярдів доларів у OpenAI! Це нереальна сума. NVIDIA стала справжнім “мейкером” у світі ШІ – надає обчислювальну потужність.

    Трохи заплутана схема, коли OpenAI платить Nvidia за чіпи, а Nvidia отримує гроші та планує постачати обчислювальну потужність. Схоже, компанії просто “оплачують” одна одну, створюючи дивний фінансовий цикл. Варто зробити окремий матеріал про взаєморозрахунки між Oracle, OpenAI, Nvidia, CoreWeave. Цікаво, як це впливає на кінцеву вартість послуг.


    Цікаво знати:

    10 гігават – потужність, яка може забезпечити енергією велике місто! Уявіть, скільки комп’ютерів має працювати, щоб спожити стільки енергії. Це свідчення того, як ресурсомісткими стають сучасні ШІ-моделі.


    Любов за допомогою ШІ? Facebook Dating та ШІ

    Перейдемо до особистого. Facebook Dating вирішив боротися зі “swipe fatigue” [втомою від свайпів] – відчуттям втоми від постійного перегляду профілів у додатках для знайомств. Вони запустили “dating assistant” [асистента знайомств] та “meet cute” [миле знайомство] – дві нові функції, які мають допомогти знаходити пари та отримати “нові” способи знайомства.

    Ці інструменти пропонують персоналізовану допомогу, кращі рекомендації на основі інтересів та вподобань. Принаймні, це не “AI girlfriend” [ШІ-дівчина], чого багато хто боявся. Якщо це допоможе людям, чому б і ні? Хоча ідея ШІ-помічника в такій сфері мене трохи бентежить. Але, можливо, це крок до нового формату спілкування?


    Не робіть, як я…

    Намагався написати “ідеальне” повідомлення для знайомства, переписав його 15 разів, використовуючи онлайн-генератори. Зрештою, воно звучало як інструкція з експлуатації. Краще щирість, ніж надто відшліфовано.


    Що далі? Готуємося до нових викликів та можливостей

    На завершення – анонс від Семена Альтмана. Він натякнув, що найближчими тижнями OpenAI випустить нові “compute-intensive” [вимогливі до обчислювальних ресурсів] продукти. Через великі ресурси, деякі функції спочатку будуть доступні лише для Pro-підписників.

    Що це? Можливо, Sora 2 (нова версія моделі генерації відео), яка потребує багато потужності. Або нова версія GPT-5 Pro, що працює з кількома агентами. Ми не знаємо, але OpenAI продовжує рухатися вперед, розширюючи межі можливого.

    Сем Альтман підкреслив, що їхня мета – знизити вартість інтелекту, щоб зробити сервіси доступними для всіх. Але вони хочуть зрозуміти, що можливо, коли “кидають багато обчислювальної потужності” на сучасні моделі. Це баланс між доступністю та дослідженням горизонтів.


    Підсумовуючи, технологічний світ переживає бум. Від ШІ, що думає за нас (ChatGPT Pulse), до моделей, що оживляють картинки (Qwen 2.2 Animate), відновлюють старі фотографії, пишуть код (Qwen 3 Max), стають частиною роботів (Gemini Robotics ER1.5) і навіть допомагають урядам (xAI). Ми бачимо народження нових маркетингових інструментів, зміну підходу до вирішення проблем та поглиблення взаємодії зі штучним інтелектом.

    Що далі? Раджу всім уважно стежити за змінами. Експериментуйте з новими інструментами. Розробники – спробуйте нові моделі кодування. Творчі люди – досліджуйте генерацію зображень та відео. Цікаві люди – спробуйте ChatGPT Pulse, щоб відчути, як ШІ може стати вашим помічником.

    Головне – залишатися відкритими до нового, вчитися адаптуватися та використовувати ці технології на користь собі та суспільству. Світ ШІ швидко змінюється, і ми маємо бути готовими брати участь у формуванні нашого майбутнього.

    А тепер – до роботи! Час дізнатися, що цікавого вийде з мого “Pulse” завтра.

    [1] Perplexity AI – сервіс пошуку та відповіді, що використовує штучний інтелект.
    [2] Дослідження “sleep time compute” – https://openai.com/blog/
    [3] Stable Diffusion – модель генерації зображень з тексту.

    Поділитися.
    0 0 голоси
    Рейтинг статті
    Підписатися
    Сповістити про
    guest
    0 Коментарі
    Найстаріші
    Найновіше Найбільше голосів
    Зворотній зв'язок в режимі реального часу
    Переглянути всі коментарі
    0
    Буду рада вашим думкам, прокоментуйте.x