Кухня Google та Дотик Майбутнього: Експерименти з AI та Дарунок для Допитливих
Привіт, любі! З вами Ліла Гарт, і я з радістю розкажу вам про те, що я дізналася, нишпорячи в глибинах кухонь Google. Там, знаєте, кипить робота над тим, щоб AI став ще більш вражаючим. І сьогодні ми з вами зануримося у світ новаторських можливостей – експерименти, які здатні відкрити двері до нового, захопливого майбутнього.
Перше, що кидається в очі, – це нові можливості генерації зображень, “випечені” безпосередньо в Google AI Studio. Уявіть собі, як ваш мозок працює над створенням візуального образу. Саме так, інтелектом і “серцем” цього процесу є велика мовна модель (LLM). Раніше, якщо ви просили LLM створити щось візуальне, вона, швидше за все, могла лише описати це словами. Зараз же Google відкриває двері, дозволяючи LLM не просто “думати” зображення, але й генерувати їх. І, що важливо, втілювати їх у реальність.
Що це означає? Ну, перше, що приходить на думку, – це не просто картинки, а можливість створювати послідовні візуальні історії, щось на кшталт анімації, де кожен наступний кадр “знає” про попередній і будується на його основі.
Відео автора розповідає про це з пристрастю, розказуючи про надзвичайну гнучкість та можливості. Тепер, наприклад, ви можете взяти, щось на кшталт “насіння”, і перетворити його в “квіточку”, яка буде розквітати. Так, це не просто картинка, це історія.
Але це ще не все! Google AI Studio дозволяє використовувати як текстові підказки, так і зображення. Наприклад, можна взяти чорно-білу фотографію і попросити AI розфарбувати її. Результат? Часто цілком реалістичний, з правильними кольорами трави, води та неба. Або ж, можна попросити змінити фон на фотографії, залишивши людину на передньому плані. У відео показали саме це: як людина опиняється на фоні космічної станції. Ефект – вражаючий! Звісно, ще є над чим працювати, але перспективи відкриваються просто космічні.
Сутність полягає у можливості досягнення узгодженості в часі. Це як якщо б ви малювали, і кожен наступний мазок пензля “знав” про попередній, створюючи загальну картину, яка змінюється, але зберігає свою цілісність.
Автор також поділився прикладами, коли текстові підказки стають основою візуальних шедеврів. Уявіть собі довге полотно тексту, на якому ви просите зобразити щось абстрактне. Результат може бути настільки ж дивовижним і надихаючим. LLM здатні фактично візуалізувати довгі, майже абзацні текстові фрагменти, створюючи зображення, які відображають їх зміст. А тепер уявіть, що ви можете створити інструкцію з картинками, крок за кроком, для малювання аніме обличчя.
Один із вражаючих прикладів, показаних у відео, стосується того, як AI в змозі “пройти” тест-дзеркало. Для тих, хто не в темі, тест-дзеркало – це коли ви ставите питання і дивитесь, чи впізнає AI себе в зображенні. У цьому конкретному експерименті, AI представив себе в формі дзеркала, що стало свідченням високої ступені самоусвідомлення. Хоча це і викликало суперечки, але сам факт появи візуального самовизначення вражає!
Звісно, ці експерименти ще на стадії розробки. Модель в Google AI Studio працює, іноді з помилками, але результат вражає швидкістю створення.
А тепер про найголовніше. Ми не говоримо про якість “фотошопу”, ми говоримо про розуміння. Штучний інтелект не просто склеює зображення з різних фрагментів, він інтелектуально комбінує їх. Це як графічний дизайнер, який розуміє, як поєднати картинки та створює щось нове, виходячи з вашого опису.
Але Google не зупиняється лише на генерації зображень. У їхній “кухні” також присутня й нова велика мовна модель – Gemma 2.0. Тепер вона доступна з відкритим вихідним кодом! Моделі Gemma доступні у різних розмірах. Це 1B, 4B, 12B та 27B. Хоча у Gemma немає можливості розпізнавати зображення, як у випадку з генерацією зображень, вона надзвичайно ефективна.
Gemma 27b – це дійсно потужний інструмент. Вона може працювати на одному GPU ноутбука або навіть телефоні. Важливо, що Gemma може обробляти до 128 000 токенів. Вона володіє багатомовністю, підтримуючи 140 мов. І що найголовніше – вона дійсно швидка, і це робить її прекрасним вибором майже для кожного. Її можна використовувати для написання детальних аналізів, наукових інструкцій, у будь якій сфері, де вам потрібен текст.
Ось що дійсно неймовірно, друзі: ви можете випробувати все це безкоштовно в Google AI Studio. Просто зайдіть, виберіть модель і експериментуйте. Це справжня мрія для будь-кого, хто хоче доторкнутися майбутнього вже сьогодні!
І на завершення, як любляча господиня, я маю повідомити вам чудову новину! Автор відео разом з Nvidia проводить розіграш RTX 4080 Super! Щоб взяти участь, потрібно відвідати безкоштовні онлайн-сесії Nvidia GTC з 17 по 21 березня, що присвячені штучному інтелекту та іншим технологіям. Деталі – в Google формі, посилання на яку ви знайдете нижче!
Тож, любі мої, світ AI відкривається перед нами, і ми можемо не лише спостерігати, а й брати безпосередню участь у його створенні.