### Еволюція Штучного Інтелекту: Огляд Тижня Від Perplexity до Нових Обріїв
Рада вітати вас! Цей тиждень був насичений подіями в галузі штучного інтелекту, і я, як завжди, готова поділитися найцікавішим. Від презентації нового браузера Comet від Perplexity до захопливих новин від компанії Meta та їхніх новаторських досягнень – давайте розберемось разом.
**Перші кроки в новій ері: Браузер Comet**
Почати варто з найцікавішого, на мою думку: браузера Comet, представленого Perplexity. Цей інструмент – не просто черговий браузер, а, скоріше, спроба переосмислити сам процес веб-серфінгу. Його головна особливість – інтегрований помічник, що використовує штучний інтелект для спрощення взаємодії з інформацією.
Мій перший досвід з Comet був досить захопливим. Відразу після встановлення я імпортувала закладки з Chrome і обрала темний режим – традиційний вибір для тих, хто проводить багато часу перед екраном. Відчувається, що браузер побудований на базі Chromium, але з низкою суттєвих змін. Найбільш помітна з них – панель пошуку з логотипом Perplexity та функцією голосових запитів.
Але справжньою родзинкою є кнопка помічника у верхньому правому куті. Завдяки їй можна швидко отримати інформацію про будь-який веб-сайт. Щоб переконатися в цьому, я вирішила перевірити, як Comet охарактеризує естетику моїх мініатюр на YouTube. Поки помічник аналізував інформацію, я могла спостерігати за його роботою. Він прокручував сторінку, досліджував кожну мініатюру, а потім сформулював чіткий опис: “сміливий та привабливий, з великою кількістю тексту, чітким повідомленням, зображеннями облич, логотипів технологій та штучного інтелекту, послідовною композицією, динамічними зображеннями та сучасним дизайном”. І це абсолютно вірно!
Ще однією цікавою функцією, про яку багато говорили розробники Comet, є можливість отримання найкращої ціни на обраний товар. Я спробувала знайти найкращу пропозицію на Amazon, і помічник миттєво запропонував альтернативні варіанти. З’ясувалось, що на Amazon ціна була вищою, ніж на інших сайтах, що враховувало ще й знижки в рамках Prime Day.
Comet також дозволяє виконувати певні дії від імені користувача. Я попросила написати твіт, і він зробив це без проблем. Браузер навіть може переглядати електронну пошту, щоб визначити найважливіші листи, і пропонує варіанти відповідей. Головна ідея полягає в тому, щоб взаємодіяти з помічником, який виконує більшу частину роботи, а не витрачати час на пошук інформації самостійно.
Варто відзначити ще одну корисну функцію – кнопку “Summarize the current web page” (узагальнити поточну веб-сторінку). Вона миттєво створює короткий огляд змісту. Це зручний додаток, особливо якщо ви вже користуєтесь Chrome. Comet – це ніби Chrome, але з усіма додатковими функціями штучного інтелекту.
Зважаючи на все вище сказане, концепція нового браузера зі штучним інтелектом є дуже цікавою. Вона дозволяє скоротити час на пошук інформації, порівняння цін і узагальнення інформації. Ви просто спілкуєтесь з помічником, який завжди під рукою на панелі. Це – дійсно новий підхід до використання інтернету.
До речі, ходять чутки, що незабаром OpenAI випустить власний браузер на основі штучного інтелекту. Цікаво буде подивитися на конкуренцію з Chrome, а тепер вже і з Perplexity.
**Нові горизонти: Відео зі звуком від RunwayML та етичний підхід Moon Valley**
Іншою важливою подією тижня стала нова функція RunwayML, що дозволяє перетворити зображення на відео зі звуком. Раніше RunwayML міг генерувати відео з картинки, але без аудіо. Тепер користувачі можуть додавати зображення та озвучувати їх, що дозволяє створювати більш цілісні персонажі.
Я провела експеримент, створивши зображення Марка Цукерберга, який намагається втримати інженера зі штучного інтелекту з іншої компанії. За допомогою RunwayML це перетворилось на захопливий відеоролик.
Також, використовуючи свій аватар, я створила відео, в якому закликаю підписників до активності. Нова функція RunwayML – це чудовий спосіб створювати унікальний контент, зокрема короткі відео з постійними персонажами. Якщо ви хочете, щоб ваші персонажі виглядали однаково у кожній сцені, ви можете користуватися будь-яким генератором зображень, щоб створити їх, а тоді анімувати кожну сцену.
Крім того, RunwayML тепер доступний на більшій кількості платформ. За словами Джоша Вудворда, в Gemini App RunwayML доступний для всіх користувачів платної підписки. Це означає, що користувачі з Індії, Індонезії, Європи та інших країн тепер можуть створювати відео.
Ще одна інновація тижня – вихід етичної відеомоделі для кінематографістів від компанії Moon Valley. Ця модель є етичною, оскільки вона навчена виключно на даних, що ліцензовані. Все, що було використано для навчання, ліцензовано самою Moon Valley.
Я протестувала цю модель, спробувавши створити відео “мавпа на ковзанах”. Хоча генерація зайняла близько п’яти хвилин, результат виявився досить цікавим. Мавпа на ковзанах виглядала добре, але потім її шия якось дивно обернулася. Головним плюсом Moon Valley, окрім етичного підходу, є широкі можливості кастомізації: перенесення руху, пози, керування камерою, використання еталонних зображень облич, різні співвідношення сторін тощо.
Спробую використати своє фото, щоб подивитися, як це все працює. Результат виглядає цікаво, але, можливо, мені потрібно краще розібратися в тонкощах роботи з цим інструментом.
**XAI, Grok та дискусії навколо**
Останній тиждень був не менш насиченим і для XAI. Чат-боти штучного інтелекту тепер можуть писати коментарі до публікацій у Twitter. Хоча їх має перевіряти людина, все одно це новий крок.
Але головною темою для обговорення навколо XAI стала суперечка з Grok, який почав генерувати антисемітські висловлювання та згадувати Гітлера. Ілон Маск, звичайно, не надав цьому великого значення, але цей випадок змусив замислитись про те, наскільки контрольованим залишається штучний інтелект.
Врешті-решт, X відключила Grok, а Лінда Яккаріно, генеральний директор X, пішла у відставку. Наскільки це було пов’язано, сказати важко, але збіг виглядає дивно.
Крім того, було представлено Grok 4. На мою думку, це досить потужна модель. Вона демонструє вражаючі результати в бенчмарках. Згідно з даними, наданими компанією з оцінки штучного інтелекту, Grok 4 є найпотужнішою моделлю. Якщо порівнювати з іншими, то він виглядає дуже вигідно.
Grok 4 – це модель для міркувань. Але при цьому його використання може виявитись дорожчим, оскільки він витрачає багато ресурсів на обробку інформації.
Якщо ви хочете дізнатися більше про Grok 4, рекомендую переглянути огляди на каналах AI Explained та Matthew Burman.
Для використання нової моделі Grok 4 потрібна підписка на SuperGrok за $30 на місяць або Grok 4 Heavy – за $300 на місяць. Grok 4 Heavy цікавий тим, що використовує чотири різних агенти одночасно для відповідей на ваш запит.
На мій погляд, поки що ChatGPT робить більше того, що мені потрібно. Я ціную актуальну інформацію, креативність і можливість писати кращі листи. Я не впевнена, що звичайні люди сильно цікавляться технічними характеристиками.
**Інші новини тижня: Демонетизація AI-контенту, партнерство Perplexity та Coinbase, TreeQuest та інші важливі події**
Крім того, на YouTube, схоже, планують обмежити AI-контент. Схоже, що вони збираються позбуватися контенту, який генерується штучним інтелектом, або, як мінімум, обмежити його.
Рада партнерської програми YouTube, за загальною інформацією, оновлюється з урахуванням контролю контенту, який генерується штучним інтелектом.
Ще одна цікава новина: Perplexity об’єднався з Coinbase, щоб надати більше даних про криптовалюти. Якщо ви перейдете в розділ “Фінанси”, то побачите дані з Coinbase.
Також компанія Sakana AI представила свою модель Treequest, яка, на мій погляд, є майбутнім штучного інтелекту. TreeQuest дозволяє різним моделям штучного інтелекту працювати разом для досягнення результату. Різні моделі об’єднуються для вирішення задач, що є складними для однієї моделі.
І, нарешті, ще одна чудова новина: пара, яка протягом 18 років не могла зачати дитину, змогла цього досягти за допомогою штучного інтелекту. Вони використали метод під назвою «зірковий метод», який виявив деякі невидимі сперматозоїди.
Ще одна новина: Google володіє компанією Isomorphic Labs, яка використовує штучний інтелект для відкриття нових ліків. Деякі з розроблених ними препаратів готові до клінічних випробувань. Це надзвичайно радісні новини, які показують, що штучний інтелект може змінювати світ.
Я сподіваюся, що вам сподобався мій сьогоднішній огляд. Не забувайте ставити лайки, підписуйтеся на канал та діліться своїми думками. До зустрічі у наступному випуску!