Звісно, ось стаття, написана в стилі Ліли Гарт, яка базується десь так, на наданій розшифровці відео:
Розширений Пошук із Застосуванням Контексту:. Як Зробити Агентів ШІ Розумнішими
Я завжди зачаровувалася магією, яка розкривається, коли ми поєднуємо людський досвід з потужністю машин. У світі штучного інтелекту, де алгоритми стають дедалі складнішими, мене особливо захоплює концепція Retrieval Augmented Generation, або RAG. Це ніби дати ШІ доступ до величезної бібліотеки знань, щоб. Він міг витягувати інформацію, необхідну для відповіді на наші питання. Це як мати найрозумнішого друга, який завжди під рукою, щоб допомогти нам.
У цьому відео ми зануримося у світ RAG, зокрема, у те, як. Зробити його ще розумнішим за допомогою концепції, яка називається “контекстне вилучення” від команди Anthropic. Це ніби дати вашому доброму другу трохи більше. Підказки, щоб він міг з легкістю зібрати відповідну інформацію.
Чому Базовий RAG – Не Найкращий Друг
Уявіть: ви використовуєте базовий RAG. Ви даєте агенту ШІ доступ до файлів з Google Drive – от, це джерело ваших знань, як-от маркетингова стратегія вашої гіпотетичної компанії (як-от та, яку створив Claude, щоб наочно продемонструвати можливості RAG), приблизно так. Агент знає, як знаходити та використовувати цю інформацію. Насправді, все чудово, поки ви просите його відповісти. На просте питання, наприклад, “Яка наша маркетингова стратегія? Більше того, “. Відповідь надходить, у ній згадується стратегія побудови спільноти – все як у вашому документі. Чудово! Але часто, без деяких додаткових “магічних” прийомів, цей процес може бути дещо неточним. RAG уявіть собі, може невірно підібрати потрібну інформацію. Щоб було ясно,
Це як згадати щось важливе, але не надавати достатньо контексту, щоб ваша аудиторія точно зрозуміла, про що йдеться.
Контекстне Вилучення: дивіться, Даємо Ключики до Зрозуміння
Ось де на сцену виходить контекстне вилучення. Воно дає можливість вашому ШІ глибше розуміти інформацію, яку він. Дивно, витягує, та бачити, як вона пов’язана з усіма іншими знаннями. Команда Anthropic тобто, представила чудові ідеї щодо того, як це зробити, в такому дусі. Ми збираємося згенерувати кращу версію нашого RAG-агента, використовуючи інструмент під назвою N8N.
Для початку, погляньте на результати! Більше того, якщо використовувати простий RAG, то у 10% випадків ваш ШІ буде помилятися. Відверто кажучи, але з контекстним вилученням та іншими хитрощами, помилки траплятимуться менш ніж у 3% випадків. А це вже відчутна різниця!
Тепер давайте розберемося, як це працює. Тут усе, що потрібно зробити, це трохи більше пояснень.
- Розбиваємо на частини (Chunking) як у будь-якому RAG. Ми ділимо наші документи на невеликі шматочки – “байти” інформації. Це потрібно, щоб не перевантажувати нашу модель мови.
- Вводимо Контекст: Найцікавіше! Зараз для кожного шматочка ми запускаємо підказку. Ми даємо повний документ і поточний шматок, щоб ШІ міг зрозуміти, де цей шматочок “живе”, про що він, і як він допоможе відповісти на питання. Цікаво, по суті, ми додаємо трохи пояснення до кожного фрагменту.
- Вбудовуємо (Embedding): Ми використовуємо мовну модель, наприклад, від OpenAI. Щоб створити векторні представлення цих шматочків (як точки на великому графіку).
- Зберігаємо у Базі Даних: Ми зберігаємо ці. Вектори у векторній базі даних, як-от Neon Postgress.
- Пошук та Відповідь: Коли ви ставите питання, ми вбудовуємо його також. Шукаємо у слухайте, базі даних відповідні шматочки та використовуємо контекст, щоб допомогти ШІ дати відповідь.
Уявіть, що ви говорите: “Ось розділ про маркетингову стратегію, а ось конкретна інформація про стратегію побудови спільноти”. Щоб було ясно, це ніби давати підказки, які покращують розуміння вашого ШІ.
Практичне Застосування: N8N уявіть собі, показує шлях
У. Відео ви побачите, як реалізовувати контекстне вилучення в N8N. По суті, потрібен приблизно, додатковий виклик LLM (великої мовної моделі). Цікаво, безумовно, n8N – це потужний інструмент, який дозволяє наочно побачити, як працюють RAG-агенти. Щоб було ну, ясно,
Давайте розділимо цей процес на частини, приблизно так.
- Запуск: все починається з файлів у Google Drive. N8N автоматично визначає нові файли або оновлення в папці.
- Цикл: Якщо завантажується уявіть собі, декілька файлів одночасно, ми запускаємо цикл, щоб обробити їх по черзі.
- Видалення та Підготовка: Щоб зберегти все в чистоті, видаляємо старі записи та збираємо метадані, такі як назва, тип та URL-адреса.
- Завантаження та Обробка Тексту: Ми завантажуємо файл із Google Drive, щоб витягнути текст. Тобто,
- Chunking (Розбиваємо на Шматочки): Ми розбиваємо. Текст на шматочки (наприклад, по 400 символів без накладок).
- Контекстне Вилучення (Магія): Ось де ми додаємо контекст. Ми передаємо кожний шматочок тексту в LLM, а вона додає трохи пояснень. Фактично,
- Вбудовування: Ми створюємо векторні представлення шматочків.
- Зберігаємо у Базі Даних: Зберігаємо ці шматочки, разом з додатковим контекстом, у базі даних.
Коли все правильно десь так, налаштовано, ви отримаєте у кожному, в такому дусі. До речі, текстовому полі фрагмент з контекстом, роздільником (три тире) та самим змістом. Тепер, коли агент ШІ отримує якийсь фрагмент, у нього є все необхідне: і інформація, і її пояснення. Очевидно,
Важливий Момент: Вибір Бази Даних
Я. Використовувала Neon, бачите, платформу для Postgress, яка працює як Superbase. Обидва вони відмінно підходять, але Neon виділяється своїм сервісом Postgress. Основна перевага – це автоскалювання. Neon динамічно змінює інфраструктуру бази даних в залежності від навантаження. Це великий плюс, оскільки вам не потрібно самостійно керувати масштабуванням, як на інших платформах. Neon також пропонує зручні функції, такі як розгалуження баз даних для тестування змін та підтримку штучного інтелекту, що може створити нові таблиці та виконувати інші дії за допомогою природної мови.
Агент ШІ: Завершальний Штрих
Тепер, коли ми. Підготували дані, ми можемо перейти до агента ШІ. Пам’ятайте, що саме контекстне вилучення робить справжню магію у нашому конвеєрі RAG. Агент має простий інтерфейс, де ви можете ставити питання. Все, що робить агент, це пошук у базі даних, а потім надання відповіді.
Використовуючи ту саму бачите, модель вбудовування щой у конвеєрі, агент може давати відповіді. Метадані, які ми включили (назва, URL), дають агенту можливість посилатися на джерела. Очевидно,
Тестування та Результат
І ось, ми розкрили чудову силу контекстного вилучення. Спробуйте запитати агента, наприклад: “У першому кварталі 2024 року, наскільки близькі ми були до завершення розробки двигуна адаптації нейронних мереж? Простіше кажучи, “. Агент знайде потрібний шматок інформації, і ви побачите результат. З контекстом, це буде набагато точніше.
Завершення: Назустріч Майбутньому
В кінці, я хочу зазначити, що на шляху до отримання кращих. Практик RAG є й інші стратегії, які ви можете спробувати (наприклад гібридний RAG з ключовими словами). Але вже зараз, контекстне вилучення є потужним кроком вперед. Я поділюся посиланням на робочий процес у відео, щоб ви могли спробувати його самостійно.
Я буду продовжувати розвивати цю тему, ділитися новими стратегіями та знаходити кращі рішення для вас.
Запам’ятайте, уявіть собі, якщо вам сподобалося це відео і ви. Хочете дізнатися більше про агентів RAG, поставте лайк і підпишіться!







