Мистецтво Еволюції: Як Штучний розумієте, Інтелект Собі Покращує Себе
У типу, прохолодному повітрі епохи штучного інтелекту, де кожна новина перетворюється на, приблизно так. Спалах світла, а розмови наповнені жаргоном, щойно випущений Darwin Girdle Machine (DGM) від Sakana AI звучить як дивовижний акорд. Це не просто ще одна програма чи алгоритм; це крок до “святого. Простіше кажучи, ґрааля” штучного інтелекту – самовдосконалюваного розуму, що навчається і розвивається сам по собі. Насправді,
Що ж такого особливого в цій машині, що примушує тремтіти серця технологів та футуристів? Давайте зануримось у деталі, як це бачить Ліла Харт.
Епоха Переломів: Чи Готові Ми До Вибуху Інтелекту?
Слово “Вибух інтелекту” уявіть собі, (Intelligence Explosion) лунає в сучасному світі, в такому дусі. Штучного інтелекту, як мантра, яка викликає суміш захоплення та тривоги. Це момент, коли ШІ переходить власний поріг самовдосконалення, здатний. Самостійно відкривати нові знання та застосовувати їх задля покращення себе. І ось, здається, ми на порозі цього.
DGM, у своїй суті, є експериментом з еволюційними принципами, що застосовуються до коду. Вона поєднує попередні теорії самовдосконалення з еволюційною механікою, натхненною теорією Дарвіна. Результатом є система, яка може змінювати власний код, експериментувати та навчатися на помилках. Ця система вже припустимо, продемонструвала значні покращення в таких бенчмарках, як Swebench та Ader Polyglot.
Сутність: Як Працює Darwin Girdle Machine? Дивно,
Уявіть собі: великі мовні моделі, що дивують нас своєю обізнаністю та креативністю. Їхня найбільша перешкода – ми самі, люди. Зрозуміло, вдосконалення цих моделей, чи то у навчанні, чи у пост-тренуванні, залежить від нашої участі. DGM змінює цю парадигму. Вона дозволяє ШІ розумієте, самостійно вдосконалювати свій код, обходячи людський фактор.
DGM використовує слухайте, ітеративний підхід:
- Починаємо з одного агента кодування. Це велика мовна модель, доповнена інструментами, пам’яттю тощо.
- Машина генерує зміни. Має уявіть собі, справу з вихідним кода, а потім робить зміни. Насправді, жодних спроб передбачити, чи будуть вони корисними.
- Вона оцінює себе. Використовує бенчмарки, щоб визначити, чи покращено якість коду.
- Додає результати до архіву. Якщо зміни виявилися корисними, вони зберігаються але
- Цикл повторюється. Поступово кожна еволюція стає кращою за попередню.
Цей процес – як природний відбір, але у світі коду. Мутації відбуваються, а реальний світ перевіряє їх. Дивно,
Глибоке Занурення: Еволюція Коду
Система ініціалізується з одним агентом кодування. Цей агент, бачите, по суті, є великою мовною моделлю, обгорнутою навколо інструментів, пам’яті і т. Д. Але, що найважливіше, його основна, “заморожена” модель – не змінюється. Простіше кажучи, вона залишається фіксованою, а змінюється лише код, який оточує її.
Агенти мають змогу читати, писати та виконувати код. Вони використовують метанавчання, тобто, працюють з підказками, робочими процесами та інструментами (scaffolding). Це те оточення, що допомагає моделі стати кращою.
DGM створює архів, куди зберігаються всі еволюційні кроки. Цікаво, у кожній ітерації батьківські скажімо, агенти самостійно змінюються, щоб створити нових агентів. Простіше кажучи, батьківський агент аналізує логи оцінювання, пропонує нову функцію. Яку потрібно реалізувати, і отримує її як завдання. Цікаво, потім він реалізує цю функцію у своєму коді, створюючи нового агента кодування.
взагалі,
Нові агенти оцінюються за допомогою бенчмарків.
Інструменти та Обмеження: Усвідомлення Безпеки
Початково агенти мають доступ лише до двох інструментів.
- Bash Tool: для керування консоллю.
- Edit Tool: для перегляду та редагування файлів.
Звісно, агенти можуть створювати власні інструменти.
DGM запускається з кількома ітераціями, застосовуючи Claude 3. 5 Sonnet New. Чесно кажучи,
Результати: Еволюція у Дії
Під час дослідження було показано, що при застосуванні DGM. Продуктивність агентів кодування збільшилася з 20% до 50% у SweBench та з 14% до 38% у Polyglot. Звичайно, ну, це величезний стрибок, в такому дусі.
Графік показує, як DGM покращує свої результати.
- DGM без відкритих досліджень: показує деяке покращення, але швидко зупиняється.
- DGM без самовдосконалення: показує значний прогрес, але теж зупиняється.
- DGM з дослідницьким підходом та з самовдосконаленням:. Продуктивність постійно зростає з часом, наближаючись до найкращих показників.
Але як все це виглядає в реальності? DGM еволюціонує свої інструменти та робочі процеси, стаючи кращим. Наприклад, DGM покращила знаєте, “Edit Tool”, дозволивши більш детальний перегляд та редагування файлів, якось так. Також вона удосконалила робочі процеси, намагаючись вирішити завдання. Та використовуючи додаткову мовну модель для оцінки результатів.
Безпека: Ходити По Лезу
Усвідомлюючи потенційні ризики. Самовдосконалюваного ШІ, розумієте, розробники вживають заходів безпеки:
- Ізольоване середовище. слухайте, Кожен тобто, етап відбувається в пісочниці.
- Тайм-ліміти. Насправді, Обмежується час, доступний в принципі, агентам і
- Обмеження області змін. Зміни фокусуються на покращенні кодування. Насправді,
Майбутнє: Слідом за Дарвіном
DGM – це доказ, що самовдосконалювальний ШІ можливий. Хоча попереду ще багато роботи, ми, здається, стоїмо на порозі чергового технологічного перелому.
Залишається лише уявити, що буде, коли слухайте, ця еволюція застосується до самої основи – до базової мовної моделі. Можливо, це і тобто, буде останнім штрихом для “вибуху інтелекту”, в такому дусі.







