Новини AI, що Захоплюють Дух: Огляд від Lila Hart
Вітаю, друзі! Lila Hart з вами, щоб разом зануритися у вир захопливих новин з дивовижного світу штучного інтелекту. Цей тиждень був щільним – новини сипались, наче зерна з щедрої жнивної машини, тож гайда розбиратися, що нового у найгарячішій сфері сучасності!
Mistral випускає блискавичний розум
Першою зупинкою нашої подорожі буде французька компанія Mistral AI. Вони просто вразили світ, випустивши свою першу модель для міркувань. І не лише випустили, а й відкрили код меншої версії! Звісно ж, я одразу кинулась її тестувати. І знаєте що? Вона просто блискавична! Швидше за інші моделі, з якими я працювала, зокрема, за Gemini 2.5 Pro, яка досі вважалася однією з найшвидших.
Ця модель – справжній подарунок для всіх, хто цікавиться AI. Вона доступна у двох варіантах:
- Magistral Small: відкритий код, 24 мільярди параметрів. Це відмінний варіант для тих, хто хоче погратися з AI, не витрачаючи купу ресурсів. Модель можна запускати на звичайному комп’ютері!
- Magistral Medium: більш потужна, корпоративна версія.
Що з результатами? Magistral Medium показала 73.6% на AMU 2024 та 90% при багаторазовому голосуванні (64 спроби). Magistral Small трохи відстає, але також вражає: 70% на AMU 2024 та 83% при багаторазовому голосуванні.
Ще враховую той факт, що модель працює з різними мовами і навіть з різними алфавітами!
Показовий момент: у відео детальне порівняння швидкості Magistral з однією з моделей OpenAI. Різниця у часі – разюча! Magistral “думає” за 5.3 секунди, а OpenAI – за 17!
Висновок: Якщо ви ще не спробували, гайда завантажувати Magistral Small та експериментувати. Доступно та потужно!
11 Labs оживляє голоси
Переходимо до 11 Labs, компанії, що робить дива з озвучкою. Вони представили V3 alpha, неймовірно емоційну модель голосу. Тепер штучний інтелект звучить ще більш реалістично!
Розробники обіцяють, що тепер у користувачів ще більший контроль над інтонаціями. Можна додавати спеціальні теги для передачі різних емоцій: здивування, переривання, обережність.
У мене виникло відчуття, що ці голоси стають занадто реалістичними. Навіть трохи моторошно, відверто кажучи…
OpenAI дивує, але не зовсім
Звісно, OpenAI не відстають. Вони також представили оновлену версію голосового режиму. Звучить добре, але… занадто по-людськи. Є паузи, “ммм” та “еее” – як у звичайній розмові. Можливо, це чудово для реалістичності, але мені, зізнаюсь, було б комфортніше, якби AI звучав трохи… як AI.
Хоча, мушу зазначити: впевнена, що незабаром ми навчимось підлаштовувати це під власні потреби!
Gemini 2.5 Pro: кодер-чемпіон
Але, що справді тішить так це оновлення від Google! З’явилася нова версія Gemini 2.5 Pro. І ця версія наче ще більше покращила результати на різних тестах. Її покращення помітні в різноманітних бенчмарках.
Наприклад, модель продемонструвала стрибок на 24 пункти ELO в Alam Marina, утримуючи перше місце з рейтингом 1470. У WebDev Arena стрибок склав 35 пунктів ELO, що дозволило їй вийти в лідери з показником 1443. Також Gemini 2.5 Pro, як і раніше, відмінно справляється із завданнями з кодування.
Для тих, хто, як і я пише код, це справжній скарб.
Google: Відео стає швидшим та дешевшим
Наступна новина від Google: Vio, їхня популярна модель перетворення тексту на відео, тепер має нову, швидку версію. Вартість – в п’ять разів менше, а швидкість роботи – вища. Чудова новина для тих, хто любить експериментувати з відео-генерацією!
Outskill: ваш квиток в AI-майбутнє (і трохи реклами)
Перед тим, як рушити далі, невеличка ремарка від спонсорів: Outskill пропонує дводенну програму навчання з AI для фахівців, засновників та керівників. Тут навчать основам генеративного AI, автоматизації, створення AI-агентів і багато чого іншого. Для перших 1000 зареєстрованих – це безкоштовно!
Meta: Інвестиції, що змінять правила гри
А тепер – головна сенсація тижня! Meta робить масштабні інвестиції в Scale AI та переформатовує свою команду штучного інтелекту. Марк Цукерберг явно відчуває, що Meta відстає в перегонах AI, і вирішив надолужити згаяне.
Інвестиція склала 14 мільярдів доларів США – за 49% акцій Scale AI. Керівник Scale AI очолив нову команду супер-інтелекту, яку особисто збирає Цукерберг. Мета – знайти 50 найкращих розумів в області AI, щоб створити супер-інтелект.
Чому лише 49%? Схоже, що повне придбання може зустріти перешкоди з боку регуляторів. Так Microsoft зробила з OpenAI. Meta, ймовірно, обрала цей обхідний шлях, щоб збільшити свою присутність в області AI.
Scale AI – це компанія, що будує інструменти збору даних для AI. Їхні дані вважаються дуже якісними та важливими для розробки AI. Тепер Meta отримала доступ до цієї дорогоцінної інформації.
Що казати, Цукерберг готовий платити неймовірні гроші, щоб заманювати найкращі уми. Наприклад, відомо про персональні контракти з оплатою понад 10 мільйонів доларів на рік.
DIA: браузер, який вміє “спілкуватися” з вкладками
Компанія, що стоїть за браузером Ark, випустила DIA, браузер, розроблений з AI на борту. Головна фішка – можливість “спілкуватися” з вкладками. Тобто, ви можете використовувати AI для роботи з відкритими вкладками.
Звісно, я не можу бути впевнена, чи це революційно, поки не спробую. Так що записуюсь у список очікування. Подивлюсь.
Що робить DIA? На прикладі:
- Редактор тексту: підсвічуєте у Gmail шматок тексту – і просите зробити його більш впевненим.
- Перевірка граматики та орфографії: у листах, щоб виглядати розумнішим і виправляти помилки.
- Підсумовування контенту: для Slack та Notion.
Звісно, багато з цих функцій вже є у Google Docs та Notion. Можливо, DIA просто об’єднує все в одному місці – подивимося.
Flux One Context Max: неймовірні зображення
Наостанок – справжній подарунок для візуалів. Artificial Analysis назвала модель Flux One Context Max одним із найкращих генераторів зображень. І, що найголовніше, вона з відкритим кодом.
Вона здатна скласти конкуренцію Google Imagine 4. Модель видає чудові зображення. В цілому рівень дуже високий.
Варто згадати, що версії Max та Pro не з відкритим кодом, а доступні лише через API або інших провайдерів.
Результат:
- OpenAI GPT40. все ще лідирує.
- Далі за рейтингами: Sedream, Recraft V3, Imagine 4 Ultra та Preview.
- Flux One Context Max – дуже близько!
У відео є десятки прикладів роботи з різними параметрами. І зображення справді вражають!
На завершення:
І на сьогодні це все! Дякую за увагу. Сподіваюся, вам було цікаво. Ставте лайки, підписуйтесь – щоб бути в курсі найцікавіших новин з світу AI. Побачимось!