“html
Звісно, ось стаття, написана у стилі Ліли Гарт, на основі наданої транскрипції. Відео:
Grok 4: Коли Штучний Інтелект Здивував Світ (і Можливо, Навіть Тебе)
Вітаю, друзі! Ліла Гарт з вами, і сьогодні ми поринемо у захопливий світ технологій, де кожен день може принести щось неймовірне. На цей раз – це громогласний вихід Grok 4, нової моделі від xAI, яка, здається, перевернула все догори дриґом.
Уявіть собі: ви сидите в зручному кріслі з. Чашкою кави, перед вами екран, а на екрані – революція. Звичайно, саме це відчуття залишилося після перегляду відео, де розмова йшла про нове творіння Ілона Маска та його команди. І, звісно, я не могла пройти повз.
З скажімо, перших секунд відео мене захопила енергія експерта, який ділився своїми враженнями. Він не просто розповідав про Grok 4, він відчував його. Він був вражений, і ці емоції передавалися мені. І це, скажу я вам, дорогого варте.
А тепер, трохи глибше у суть. Grok 4, судячи з усього, просто розірвав усі бенчмарки. Він, як справжній чемпіон, викинув з рингу будь-яких конкурентів. Йдеться про GPT-4 від OpenAI, Gemini 1. Фактично, слухайте, 5 Pro, Claude 3 Opus. І це не просто дивіться, слова і експерт наводить конкретні цифри та порівняння.
Один з цікавих показників – це Arc AGI Eval. Достатньо складний бенчмарк, де моделі демонструють свої здібності. Тут Grok 4 показав результати, які перевершують все, що було раніше. Це як стрибок у космос з рівня землі!
Що це означає для нас? Щоб було ясно, це означає, що ШІ стає ще розумнішим, ще ефективнішим, і, звісно, ще найбільш захопливим.
Але найцікавіше, що Grok 4 не просто кращий, він ще й ефективніше використовує ресурси. Це як отримати найкращий автомобіль за зниженою ціною. Перемога в усіх відношеннях!
І, звісно, не обійшлося без перевірки на чесність. Автор відео зустрівся з коментарем від загалом, Грега, президента Arc Prize, який підтвердив, що xAI зв’язалися з ними для тестування Grok 4. Результати перевершили всі очікування. Простіше кажучи,
“Grok 4 – тепер найкраща публічно доступна типу, модель Arc AGI Eval”, – слова Грега, які лунають як музика для вух всіх зацікавлених.
Але це ще не все. Експерт переходить до ще складнішого тесту – Humanity’s Last Exam. Це тест, з яким навіть люди справляються не завжди. Тут також Grok 4 показав неймовірні результати, значно випереджаючи своїх конкурентів. 38. 6% проти 25% у GPT-4 та 27% у Gemini 1. 5 Pro і а Grok 4 Heavy взагалі досягнув 44. 4%! Просто неймовірно!
Уявіть собі, що ваш ШІ-асистент раптом стає вдвічі розумнішим. Що бачите, ви йому доручите тому які нові горизонти відкриються? До речі,
На додачу, Grok 4 також відзначився в інших бенчмарках, таких як GPQA та MMLU. Це наприклад, як спортсмен, який перемагає на всіх змаганнях.
Але й це ще не все! Розробники Grok також повідомили про новий режим голосового спілкування. Відверто кажучи, і тут, шановні друзі, я не втрималась від посмішки. Автори відео навели приклад з піснею про Diet Coke у виконанні Grok. Створений нею вірш здався мені дещо моторошним, але показав, як далеко зайшла технологія.
Окрема увага приділялася Grok 4 Heavy – найбільшій та найрозумнішій моделі. Вона демонструє зовсім бачите, інший підхід до розрахунків, використовуючи кілька агентів та порівнюючи їхні відповіді. Це наче команда експертів, які працюють над вирішенням однієї задачі. Чесно кажучи, звісно, це коштує дорожче, але й результати вражають.
Ще один цікавий момент – Grok 4, здається, не має жодних обмежень щодо цензури. Використання певних уявіть собі, в принципі, команд може повністю розблокувати модель. Це слухайте, відкриває нові можливості, хоча і з певними ризиками.
Звісно, все це викликає інтерес до практичного застосування. Чесно кажучи, справа в тому, що експерт в відео вирішив перевірити Grok 4 на практиці. Він створив завдання, з яким інші ШІ мали проблеми.
Перше завдання – скласти рейтинг 50 найкращих снеків у світі за кількістю спожитих одиниць. Чесно кажучи, grok 4 досить довго аналізував інформацію, використовуючи пошук в Інтернеті, в такому дусі. І що цікаво, його поведінка нагадувала GPT-4 та Gemini 1. 5 Pro. Він видавав схожі результати, але був значно кращим. Безумовно,
Автор відео порівнював результати Grok 4 з відповідями OpenAI’s DeepMind. Інколи вони суперечили один одному. В кінцевому результаті Grok 4 продемонстрував дуже детальний та обґрунтований аналіз, навіть визнавши, що відповіді DeepMind були більш точними. Цікаво,
Наступний тест – пошук найдешевшої відеокарти GTX 1080 Ti. Більше того, тут також Grok 4 показав себе з найкращого боку, знайшовши пропозицію, якої не було у конкурентів. Це свідчить про його здатність знаходити інформацію та реалістичні пропозиції.
Останній тест – пошук інформації про людину, яка започаткувала тренд V3 Bigfoot AI. Тут, на жаль, Grok 4 не впорався і видав неправильну інформацію. Але автор скажімо, відео відзначив, що це показує, що навіть найкращі моделі можуть помилятися.
експерт підсумував свої спостереження. Grok 4 значить, вразив усіх своїми результатами в бенчмарках. Він близький або навіть перевершує GPT-4 та Gemini 1. 5 Pro. Водночас, є певні обмеження, особливо у специфічних та. Очевидно, звичайно, нюансованих питаннях, де всі моделі ще мають проблеми. А відсутність мультимодальності – великий недолік для багатьох користувачів.
Наостанок, автор підкреслив, що саме такі нюансовані питання і є майбутнім ШІ. Потрібно прагнути не лише до великих чисел, а й до здатності вирішувати реальні проблеми. Безумовно,
Особисто для мене, як для людини, яка завжди стежить за. Трендами, Grok 4 – це чудовий приклад того, куди ми рухаємось. Технології стають все більш потужними, але разом з цим вони стають і більш людяними. Вони вчаться розуміти нас, наші потреби, і навіть наші слабкості. Звичайно,
І, звісно, як завжди, я запрошую вас до обговорення. Діліться своїми враженнями від Grok 4, пишіть у коментарях. Свої питання, і давайте разом досліджувати цей захопливий світ ШІ.
Дякую за увагу, до зустрічі!