Штучний Інтелект Тижня: Від Лами 4 до Відкритого Космосу ШІ (Переклад відео)
Автор: Кейсі Байт
Привіт, ґіки та ентузіасти технологій! 👋 На цьому тижні світ ШІ буквально вирує! Тут є все: драматичні історії, неймовірні досягнення та подих майбутнього. Давайте без зайвих слів поринемо в найцікавіше!
Llama 4: Не все Так Просто? 😬
По-перше, трохи драми. Llama 4, надзвичайно очікувана модель з відкритим кодом від Meta, потрапила в халепу. Судячи з усього, під час розробки щось пішло не так, що призвело до “повного провалу” (цитата з відео).
- Що сталося? Хтозна! Ходять чутки, що витік інформації від інсайдерів припускав паніку в команді Meta Gen AI ще до релізу.
- Звинувачення: У всьому звинувачують DeepSeek V3, модель від невідомої компанії з “мізерним бюджетом на навчання”, яка, за чутками, вибила Llama 4 з лідерів у бенчмарках.
- Бенчмарки vs Реальний Світ: Виявилося, що Meta може бути “грала” з результатами, випускаючи різні версії моделі – одну для бенчмарків, іншу для публічного використання. Етан Моллік (Ethan Mollik) зазначив, що модель, яка перемогла в LM Marina, сильно відрізнялася від тієї, що була випущена.
- Відмова від Llama 4: І вишенька на торті: колишні співробітники Meta тепер дистанціюються від Llama 4. У відео (особливо епізод про Llama 4) показують, як люди з Meta переходять в OpenAI та публічно відмовляються від зв’язків з Llama 4. Це однозначно не той PR, на який розраховувала Meta.
Висновок: Незважаючи на мільярдні інвестиції та найкращі таланти, Meta зіткнулася з серйозними проблемами. Чекаємо на офіційні роз’яснення та технічний звіт, але поки що ситуація виглядає не дуже добре.
Anthropic: Claude з Розширеними Можливостями та Погляд у Майбутнє 🚀
Поки в Meta гарячково виправляють помилки, Anthropic випускає чудові новини.
- Max Plan для Claude: Новий план підписки, який пропонує в 5-20 разів більше використання, ніж звичайний план. Відмінна новина для тих, хто часто використовує Claude і не хоче чекати на оновлення лімітів.
- Claude 4: Дорога До Відкриттів: Готуйтеся! Claude 4 з’явиться протягом найближчих 6 місяців. За словами Джареда Каплана (Jared Kaplan), швидкість розвитку ШІ прискорюється, особливо в області післянавчальної підготовки та навчання з підкріпленням.
- Висновок: Anthropic демонструє активний розвиток, зосереджуючись на покращенні своїх моделей.
Elon Musk та Grok: Швидке Наздоганяння? 🏎️
Ілон Маск також не відстає.
- Grok 4: Незабаром! Маск анонсував вихід нових моделей Grok “до кінця року”.
- Потенціал: Враховуючи, що Grok стартувала з позицій позаду, але вже наздогнала конкурентів, велика ймовірність, що наступна версія перевершить існуючий стан справ.
OpenAI: Шлях до Відкритого Коду, Memory та Безпеки 🔓
OpenAI, нарешті, відважуються на кроки до відкритості. Їхні рішення, попри затримку, заслуговують на увагу.
-
Відкритий Код На Підході: OpenAI планує випустити потужну модель з відкритим кодом. Вони визнають важливість відкритого коду та хочуть бути його частиною.
-
Memory (Пам’ять) в ChatGPT: Неймовірна Сила: Епізод для спільноти з описами можливостей пам’яті в ChatGPT
- Два Способи Використання:
- Використовувати минулі взаємодії (ставити питання на основі минулих розмов).
- Налаштовувати майбутні взаємодії (ставити питання та просити кидати виклик припущенням).
- Два Способи Використання:
-
Безпека під Загрозою? Financial Times повідомила, що OpenAI скоротила час тестування безпеки своїх моделей.
- Проблема: Тестерам дають лише кілька днів для проведення оцінок, тоді як раніше це займало кілька місяців.
- Пояснення: Швидкий цикл розвитку, конкуренція. Компанії хочуть випустити моделі швидше.
- Наслідки: Зменшення пріоритету безпеки може привести до непередбачуваних результатів.
- Критика: Тестування може бути недостатнім, щоб виявити небезпечні можливості. Можуть з’явитися через кілька місяців після випуску.
- Ризики: Потенційне використання для зброї та реальна шкода.
-
AGI на Порозі? OpenAI стає відвертою щодо AGI (Artificial General Intelligence – Загальний Штучний Інтелект). CFO OpenAI Сара Фрієр (Sarah Frier) вважає, що ми вже близькі до AGI, хоча ще не використовуємо його потенціал на повну. Те ж саме каже і Сем Альтман (Sam Altman).
-
Ціль OpenAI: Підвищення продуктивності розробників. Альтман зосереджений на тому, щоб зробити програмістів у 10 разів продуктивнішими, а не на повній автоматизації кодування.
Висновок: OpenAI робить значні кроки, але також стикається з важливими викликами у сфері безпеки.
Deepcoder 14B: Маленька, Але Потужна Модель Кодування 💪
- Що це? Open-source модель кодування з 14 мільярдами параметрів.
- Досягнення: Показує результати, порівнянні з пропрієтарними моделями, такими як OpenAI 03 Mini та 01.
- Ключ до Успіху: Високоякісні дані з різних джерел та використання підкріплювального навчання.
- Висновок: Відкритий код дозволяє розширити можливості, що були недоступними раніше.