Новини AI, припустимо, що Захоплюють Дух: Огляд від Lila Hart
Вітаю, друзі! Lila Hart з вами, щоб разом зануритися у. Вир захопливих новин з дивовижного світу штучного інтелекту. Цей тиждень був щільним – новини сипались, наче зерна з щедрої, в такому дусі. Жнивної машини, тож гайда розбиратися, що нового у найгарячішій сфері сучасності!
Mistral випускає блискавичний розум
Першою зупинкою нашої подорожі буде французька компанія Mistral AI. Простіше кажучи, вони просто вразили світ, випустивши свою першу модель для міркувань. І не лише випустили, а й відкрили код меншої версії! Звісно ж, я одразу кинулась її тестувати. І знаєте що? Простіше кажучи, вона просто блискавична! Швидше за інші моделі, з якими я працювала, зокрема, за Gemini 2. 5 Pro, яка досі вважалася однією з найшвидших. Звичайно,
розумієте,
Ця модель – справжній подарунок для всіх, хто цікавиться AI. Вона доступна у двох варіантах:
- Magistral Small: відкритий код, 24 мільярди параметрів. Це відмінний варіант для тих, скажімо, хто хоче погратися з AI, не витрачаючи купу ресурсів. Модель можна запускати на звичайному комп’ютері! Цікаво,
- Magistral Medium: більш потужна, корпоративна версія але
Що з результатами? Magistral Medium показала 73. 6% на AMU 2024 та 90% при багаторазовому голосуванні (64 спроби). Magistral Small трохи відстає, але також вражає: 70% на AMU 2024 та 83% при багаторазовому голосуванні.
Ще враховую той факт, що модель працює з різними мовами і навіть з різними алфавітами!
Показовий момент: у відео детальне порівняння швидкості Magistral з однією з моделей OpenAI. Різниця у часі – разюча хоча Magistral “думає” за 5. 3 наприклад, секунди, а OpenAI – за 17!
Висновок: Якщо ви ще не спробували, гайда завантажувати Magistral Small та експериментувати. Доступно та потужно!
11 Labs оживляє голоси
Переходимо до типу, 11 Labs, компанії, що робить дива з озвучкою. Вони представили V3 alpha, неймовірно емоційну модель голосу. Тепер штучний інтелект звучить ще більш реалістично!
Розробники обіцяють, скажімо, значить, що тепер у користувачів ще більший контроль над інтонаціями. Можна додавати спеціальні теги наприклад, для передачі різних емоцій: здивування, переривання, обережність.
У мене виникло відчуття, що ці голоси стають занадто реалістичними. Навіть тобто, трохи моторошно, відверто кажучи.
OpenAI дивує, але не зовсім
Звісно, OpenAI не відстають. Вони також представили оновлену версію голосового режиму. До речі, припустимо, звучить добре, але проте занадто по-людськи. Насправді, є паузи, “ммм” та “еее” – як у звичайній розмові. Можливо, це чудово для реалістичності, але мені, зізнаюсь, було б комфортніше, якби AI звучав трохи. Як AI. Насправді,
Хоча, мушу зазначити: впевнена, що незабаром ми навчимось підлаштовувати це під власні потреби!
Gemini 2. 5 Pro: кодер-чемпіон
Але, що справді тішить так це оновлення від Google! З’явилася нова версія Gemini 2 бо 5 Pro. І ця версія наче ще більше покращила результати на різних тестах. Насправді, наприклад, її покращення помітні в різноманітних бенчмарках.
Наприклад, модель продемонструвала стрибок на 24 пункти ELO. В Alam Marina, утримуючи перше місце з рейтингом 1470. У WebDev Arena стрибок склав 35 пунктів ELO. До речі, що дозволило їй вийти в лідери з показником 1443. Також Gemini 2. 5 Pro, як і раніше, відмінно справляється із завданнями з кодування.
Для тих, хто, як і я пише код, це справжній скарб. Цікаво,
Google: Відео стає швидшим та дешевшим
Наступна новина від Google: Vio, їхня популярна модель перетворення тексту на відео, тепер має нову, швидку версію. Вартість – в п’ять разів менше, а швидкість роботи – вища. Чудова новина для тих, хто любить експериментувати з відео-генерацією!
Outskill: ваш квиток в AI-майбутнє (і трохи реклами)
Перед тим, як рушити далі, невеличка. Справа в тому, що ремарка від спонсорів: Outskill пропонує дводенну програму навчання з AI для фахівців, засновників та керівників. Тут навчать наприклад, основам генеративного AI, автоматизації, створення AI-агентів і багато чого іншого. Для перших 1000 зареєстрованих – це безкоштовно!
Meta: Інвестиції, що змінять правила гри
А тепер – головна сенсація тижня! Meta робить масштабні інвестиції в Scale AI та переформатовує свою команду штучного інтелекту. Марк Цукерберг явно відчуває, що Meta відстає в перегонах AI, і вирішив надолужити згаяне.
Інвестиція склала 14 мільярдів доларів США – за 49% акцій Scale AI. Керівник Scale припустимо, AI очолив нову команду супер-інтелекту, яку особисто збирає Цукерберг. Цікаво, до речі, мета – знайти 50 найкращих розумів в області AI, щоб створити супер-інтелект.
Чому лише 49%? Схоже, що повне придбання може зустріти перешкоди з боку регуляторів. Насправді, до речі, так Microsoft зробила з OpenAI. Meta, ймовірно, обрала цей обхідний шлях, щоб збільшити свою присутність в області AI.
Scale AI – це компанія, що будує інструменти збору даних для AI. Їхні дані вважаються дуже якісними та важливими для розробки AI. Тепер бачите, Meta отримала доступ до цієї дорогоцінної інформації.
Що казати, Цукерберг готовий платити неймовірні гроші, щоб заманювати найкращі уми. Наприклад, відомо про персональні контракти з оплатою понад 10 мільйонів доларів на рік.
DIA: наприклад, браузер, який вміє “спілкуватися” з вкладками
Компанія, що стоїть. За браузером Ark, випустила DIA, браузер, розроблений з AI на борту. Відверто кажучи, головна фішка – можливість “спілкуватися” з вкладками. Тобто, ви можете використовувати AI для роботи з відкритими вкладками. Тобто,
Звісно, я не можу бути впевнена, чи це революційно, поки не спробую. Так що записуюсь у список очікування. Подивлюсь.
Що робить DIA? На прикладі:
- Редактор тексту: підсвічуєте у Gmail. Шматок тексту – і просите зробити його більш впевненим.
- Перевірка граматики та орфографії: у листах, щоб виглядати розумнішим і виправляти помилки.
- Підсумовування контенту: для Slack та Notion.
Звісно, багато з цих функцій вже є у Google Docs та Notion. Можливо, DIA просто об’єднує все в одному місці – подивимося.
Flux One Context Max: неймовірні зображення
Наостанок – справжній подарунок для візуалів. Artificial Analysis назвала модель Flux One Context Max одним із найкращих генераторів зображень. І, що найголовніше, вона з відкритим кодом. Відверто кажучи,
Вона здатна скласти конкуренцію Google Imagine 4. Модель видає чудові зображення. В цілому рівень дуже високий.
Варто згадати, припустимо, що версії Max та Pro не з. Відкритим кодом, а доступні лише через API або інших провайдерів.
Результат:
- OpenAI GPT40. Все ще лідирує.
- Далі за рейтингами: Sedream, Recraft V3, Imagine 4 Ultra та Preview. Справа в тому, що
- Flux One Context Max – дуже близько!
У відео є десятки прикладів роботи з різними параметрами. І зображення справді вражають проте
:
І на сьогодні це все! Дякую за увагу. Сподіваюся, вам було цікаво. Зрозуміло, ставте лайки, підписуйтесь – щоб бути в курсі найцікавіших новин з світу AI. Побачимось!