Відкриваємо Двері у Майбутнє: Розмова з Лоґаном Кілландом. Про AI в Google та Еволюцію Розробника
Привіт, друзі-гіки! Кейсі Байт на зв’язку, готовий поділитися з вами найцікавішими новинами зі світу штучного інтелекту. Сьогодні ми зануримося у захопливу бесіду з Лоґаном Кілландом, який ділиться своїми думками про майбутнє AI, розробників та зміни, які відбуваються у Google. Пристебніть ремені, буде цікаво!
Глибокий Світ DeepMind та Майбутнє Розробників
Лоґан з оптимізмом. Дивиться на зростання кількості інженерів у зв’язку з розвитком AI. Він розглядає це як позитивну тенденцію, оскільки AI робить розробників більш продуктивними.
Ключові Моменти:
- Зростання попиту на інженерів: AI розширює можливості та підвищує швидкість, з якою розробники можуть створювати програмне забезпечення. Безумовно,
- Важливість базових навичок: Навіть з AI, основні навички розробки. Такі як системне мислення та вміння вирішувати проблеми, залишаються критично важливими.
- Відповідальність за інструменти: уявіть собі, У майбутньому розробники повинні будуть володіти глибшими знаннями коду, замість того, щоб покладатися виключно на AI. Щоб було ясно,
загалом,
Лоґан згадує придбання команди наприклад, Windsurf, якось так. Компанією Google DeepMind як приклад тренду, коли компанії купують команди талановитих інженерів. Хоча сам продукт Windsurf не був придбаний, це відображає цінність досвіду та знань розробників у сфері AI.
“Я думаю, це поганий результат для екосистеми стартапів, – каже, десь так. Лоґан, – якщо немає шляху до IPO або об’єднання з більшими компаніями. “
AI-асистенти: Форм-фактори та Майбутнє Взаємодії
Лоґан розмірковує про майбутнє інтерфейсу AI, і передбачає поєднання різних форм взаємодії:
- Чат: Залишається корисним.
- Аудіо: Стає все більш важливим, особливо в певних контекстах, наприклад, в автомобілях.
- Асинхронні агенти: Агенти, що працюють у фоновому режимі, можуть значно змінити спосіб взаємодії. Лоґан візуалізує інтерфейс, де агенти надсилають запити для затвердження, що дозволить користувачам контролювати їх дії.
Лоґан також обговорює можливість використання значить. AR-окулярів, але скептично ставиться до їх повсюдного використання. Він вважає, що більш продуктивне використання AI буде на комп’ютерних екранах, де можна безпосередньо ділитися інформацією з моделями.
Голос як Інтерфейс: Говоримо з AI
Лоґан ділиться новинами про роботу Google над голосовими технологіями:
- .
- Project Astra: Створення візуальних та аудіо досвідів, які використовують AI, демонструють, що модель може розуміти та генерувати аудіо.
- Gemini 1. 5: Моделі можуть генерувати аудіо, забезпечуючи більш реалістичну взаємодію.
- API для розробників: API дозволяє створювати аудіоподібні досвіди, як у Project Astra.
Лоґан підкреслює важливість голосового інтерфейсу, особливо у контексті використання в автомобілі. Але також визнає деякі недоліки, такі як складність роботи з кодом через голос.
Майбутнє Вебперегляду: Чи будемо ми відвідувати сайти? Дивно,
Лоґан розмірковує про майбутнє взаємодії з інтернетом, і вірить в агентів, які зможуть зробити інформацію більш доступною.
- Кількість вебсайтів: Зростає вартість довіри та достовірності у світі AI-генерування. Базова пошукова система, Google Search, залишається актуальною.
- Глибокий пошук: Агенти можуть покращити існуючі пошукові моделі для певних. Задач, наприклад, пошуку подарунків, де людина бажає бути в центрі прийняття рішень. Безумовно,
- Подорожі: Лоґан не вважає, що агенти зроблять подорожі швидше у типових випадках, але визнає, що вони значно полегшать складні подорожі.
- Втрата сайтів: Лоґан уявляє майбутнє, де потреба у відвідуванні певних сайтів буде меншою.
Від Моделей до Систем: Розширюємо Можливості AI
Лоґан обговорює перехід від базових “ваг” до повноцінних систем. Фактично,
- Попереднє scaffolding: Перші AI-продукти потребували серйозного scaffolding, щоб забезпечити безпеку та передбачуваність. Фактично,
- Вдосконалення моделей: Моделі стали припустимо, більш досконалими, знаєте, що призвело до зменшення потреби у підтримці, якось так.
- Reasoning скажімо, models: Розвиток моделей розважливості прискорює цей процес. Простіше кажучи,
Для стартапів важливо зосередитися на областях, які ще не повністю розв’язані.
Розробники та AI: Збільшення, а не заміщення
Лоґан висловлює впевненість у тому, що кількість інженерів буде зростати, оскільки AI покращує продуктивність розробників:
- Критичне мислення: Основні навички, здобуті в комп’ютерних науках, залишаться важливими, а робота розробника буде трансформуватися, але не зникне, в такому дусі.
- Детермінізм: Інструменти AI ну, можуть покращувати, але не замінюватимуть необхідність контролювати код. Дивно,
Лоґан вірить, розумієте, що AI-інструменти мають на меті допомогти розробникам, а не замінити їх.
V3: Новий Рівень Відео
Команда Google випустила V3 з функцією. Генерації аудіо у відео, що дозволяє багатьом користувачам ефективно виробляти відео-контент.
- Основні переваги слухайте, V3: Інтеграція аудіо, покращення якості та доступності.
- Використання API V3: Розширення функціональності: маркетинг, персоналізована реклама, створення відеоконтенту з низьким бюджетом.
- Майбутнє V3: Інтеграція “Flow”(передача досвіду), покращення аудіо, збільшення тривалості відео.
Лоґан зазначив, що в майбутньому смак (taste), правдивість (authenticity) та особистий вплив (agency) є найважливішими параметрами у світі AI.
Дифузійні Моделі: типу, Швидкість бачите, має значення
Лоґан поділився інформацією про, типу того. Дифузійні моделі, які, на відміну від трансформаторів, мають обмежені можливості масштабування. Справа в тому, що
- Швидкість: Швидкість роботи моделей важлива для продуктивності та користувацького досвіду. До речі, насправді,
- Дифузія уявіть собі, для UI: Дифузійні моделі можуть бути використані для генеративного інтерфейсу користувача. Щоб було ясно,
Еволюція Моделей: Перегони в обчисленнях
припустимо,
Лоґан обговорив важливість інвестицій в пре-тренування та пост-тренування, зокрема те, що було зазначено в XAI, що для них вони мають рівні обчислювальні потужності для цих двох етапів.
- Три виміри масштабування: Передтренування, пост-тренування та міркування.
- Синтез масштабів: Вага значень пре-тренування збільшує значення пост-тренування та розважливості, тому важливі всі три. Щоб було ясно, справа в тому, що
Gemini 3: Про що мріє Кейсі Байт?
Лоґан ухилився від конкретики про Gemini 3, але зазначив, що він буде дуже цікавим.
- Побажання: Збільшення швидкості, більше інструментів у AI Studio.
Конкуренція в AI: Сильні сторони Google
Лоґан підкреслює, що Google активно інвестує в наукові дослідження, що призводить до інновацій у базових моделях, в такому дусі.
- Різноманітність: Google робить акцент на мультимодальності, розумінні відео, кодуванню.
- TPU: Створення спеціальних чипів TPU як диференціатор для обробки великих даних.
- Масштаб: Google слухайте, розповсюджує AI для мільйонів користувачів в усьому світі.
Фінальні думки: Агенти, майстерність та відповідальність
Лоґан Кіллан та Кейсі Байт погодилися, що майбутнє AI залежатиме від трьох факторів: майстерності, оригінальності та впливу.
Лоґан також зазначив, що використання AI вносить внесок у відкритий, а не закритий світ.
Сподіваюся, вам сподобалася наша подорож у світ AI! Залишайте свої типу, коментарі, діліться думками та слідкуйте за новими випусками Кейсі Байт! До зустрічі!