Звісно, ось стаття, написана Лілою Харт, як ви просили.
Ace-Tep: Коли алгоритми співають серцем (та трішки з саксофоном)
У світі, де штучний інтелект дедалі глибше проникає у творчі сфери, поява нового інструменту завжди хвилює. А коли цей інструмент – генератор музики – і до того ж з відкритим кодом, хвилювання стає ще більшим. Нещодавно, на просторах YouTube каналу Matt VidPro AI, відбулася захоплива зустріч з Ace-Tep, новою розробкою від Stepfun AI та Ace Studio. Зустріч, яка змусила затамувати подих усіх, хто вірить у магію музики, незалежно від того, чи її творить людина, чи алгоритм.
Я, Ліла Харт, сьогодні поділюся своїм враженням від цієї зустрічі та музичного експерименту. Адже, як сказав ведучий, цей інструмент – ближчий конкурент таким гігантам, як Suno AI та Udio. Що ж, давайте розберемось, чи так це насправді.
Відображення майбутнього: Відкритий код, великі можливості
Перше, що привертає увагу – це відкритий код. Ace-Tep ліцензований за Apache 2.0, а це означає, що ентузіасти та розробники мають безмежні можливості для експериментів, змін та покращень. Це не просто інструмент, це цілий світ, куди може зануритися кожний охочий. Тим паче, модель може похвалитися 3,5 мільярдами параметрів, а це вже серйозний аргумент у скарбничку її потенціалу.
Далі – параметри. Модель підтримує генерацію текстів пісень (що вже само по собі є неймовірно крутим), та здатна створювати повноцінні пісні тривалістю до чотирьох хвилин. Правда, з такою швидкістю, як у ролику (20 секунд!), їй потрібна потужна відеокарта – A100 GPU. Що ж, сучасні реалії. Хоча, як пізніше зазначає ведучий, за певних умов, Ace-Tep можна буде запустити і на більш скромному обладнанні.
Одразу ж варто зазначити, що візуальний аспект відео захоплює: ведучий вживається в роль, ділиться своїми враженнями, а ще й демонструє результат роботи моделі. І ось тут починається найцікавіше – прослуховування. Пісня, згенерована AI, має дивовижну ауру, і, що не менш важливо, – вона полонить серце. Це не просто набір звуків, а справжня музика, з мелодією, емоціями та, навіть, саксофоном!
Ведучий відзначає: це не просто мрія, це початок нової ери. Ери, де музика стає доступною для кожного, де алгоритми стають партнерами у творчості.
Локальний запуск: Реальна перспектива для творчості
Найбільш цікаве для багатьох – можливість запускати Ace-Tep локально, на власному комп’ютері. Власники потужних відеокарт можуть сміливо спробувати. Але навіть з цим є цікаві деталі. Навіть Макбук M2 Max здатний впоратись з цим AI, хоча і дещо повільніше, ніж Nvidia. Звісно, це потребує значних ресурсів відеопам’яті (20+ GB), але сама перспектива – запускати модель на власному ПК – неймовірно приваблює.
Згідно з інформацією, отриманою з GitHub, час генерації хвилини аудіо на RTX 3090 становить близько 5 секунд, на A100 – трохи більше двох секунд, а на RTX 4090 – менше двох секунд. Варто зазначити, що це для низької якості (10-20 inference steps), збільшення кількості кроків (до 60) подвоює час генерації. Отже, навіть на відносно “скромному” 3090, хвилина музики за 10 секунд – це дуже навіть непогано.
Автори ролика відзначають, що немає потреби в одному кліку для встановлення, сподіваються, що з часом це з’явиться на платформі, наприклад, Pinocchio. Хоча, в процесі встановлення є чимало кроків, які потрібно виконати.
Ace-Tep: У глибинах функціоналу
Ace-Tep вражає своєю багатофункціональністю. Підтримка різних форматів описів – від коротких тегів до розгорнутих текстів, а ще й підтримка 19 мов. Що надзвичайно приємно – є й українська мова в переліку. Модель здатна генерувати реалістичні інструментальні треки, складні аранжування з кількома інструментами, та вокальні партії з різними стилями.
Автори подбали і про аудіо-інпейнтінг – можливість завантажувати аудіо, вирізати з нього частини, та генерувати нові. Також, модель може редагувати тексти пісень. Функція, яку ще не бачили у інших генераторах музики.
Майбутнє: Експерименти та відкриття
Найбільш захопливою частиною відео стало анонсування майбутніх розробок. Серед них:
- Rap Machine: Модель, яка буде навчатися виключно на реп-даних, створюючи унікальні композиції та навіть “батли”.
- Stem Gen: Контрольна мережа, навчена на багатодоріжкових даних для генерації окремих інструментальних партій.
- Singing to accompaniment: Зворотній процес Stem Gen, який дозволить створити інструментальний супровід для вокальної партії.
Очікування від цих майбутніх оновлень надзвичайно великі. Адже вони відкривають нові горизонти для музикантів та творців.
Враження від експерименту: Від “McDonald’s” до “Country”
Ведучий не обмежився теорією, а вирішив провести експеримент. Він попросив ChatGPT згенерувати текст пісні про “McDonald’s” та зламану машину для морозива. Експеримент дійсно цікавий та показав результати.
Згенерований трек вийшов кумедним та слухабельним. І хоча якість не була ідеальною, для безплатної моделі з відкритим кодом результат вражає.
Ведучий відзначає, що якість генерування на середньому рівні, проте для роботи це чудовий результат. Можна коригувати параметри, змінювати налаштування та досягти бажаного результату, чого немає в деяких закритих моделях.
Далі експеримент перейшов у нову площину: вдосконалення. Збільшуючи inference steps, автор намагався покращити якість.
Потім була спроба створити трек у стилі хіп-хоп, з темою алергії. Результат вийшов специфічним – ритм був, а ось з генеруванням вокалу виникли проблеми. Остання спроба – кантрі-балада. Теж не ідеально, але для конкретного стилю та відгуків ChatGPT виглядає добре.
Висновок: Ace-Tep – багатообіцяюча модель, але потребує часу та експериментів для досягнення найкращих результатів.
Підсумки: Що ж далі?
Ace-Tep – це багатообіцяюча розробка, яка демонструє потенціал штучного інтелекту у сфері музики. Хоча вона і не досягла рівня таких гігантів, як Udio чи Suno, її можливості та відкритий код роблять її надзвичайно привабливою для експериментів та творчості.
Найбільшою перевагою Ace-Tep є її відкритість. Це дає змогу не тільки користуватися нею безкоштовно, але й адаптувати її під свої потреби, вносити зміни та покращувати.
Найбільш важливе, що робить Ace-Tep особливим – це відчуття натхнення, яке вона викликає. Це інструмент, який здатний надихнути на творчість, спонукати до експериментів та допомогти реалізувати найсміливіші музичні задуми.
Я впевнена, що спільнота творців та розробників знайде безліч способів використання цього інструменту і змусить його зазвучати новими, ще більш яскравими фарбами. Ace-Tep – це лише початок захопливої музичної подорожі, яка обіцяє багато відкриттів та неймовірних емоцій. І я з нетерпінням чекатиму на наступні кроки цієї чудової історії.