З'єднання Разом: Агентський RAG та Графи Знань - Ваш Шлях до Ефективного Пошуку у Світі ІІ

З’єднання Разом: Як скажімо, ІІ-Агенти та Графи Знань Перетворюють Пошук Інформації

За чашкою. Кави, як я скажімо, часто буває, я поринула у захопливий світ розробок штучного інтелекту. Цього разу моя “мандрівка” зосередилася на пошукових стратегіях для ІІ-агентів. Я прагнула знайти найкращий спосіб надати моїм програмам можливість досліджувати та розуміти великі обсяги інформації. І ось що наприклад, привернуло мою увагу: агентський RAG та графи знань.

Звісно, я вже поділилась цим досвідом на. Моєму каналі, адже ці дві стратегії виявилися надзвичайно потужними. Фактично, але що найцікавіше, їх легко поєднати, що створює. Насправді, неймовірно ефективні системи пошуку знань для наших ІІ-агентів. І саме про це ми сьогодні поговоримо. Відверто кажучи, тож давайте разом заглибимося у цю захоплюючу тему!

У цьому відео я розкрию секрети створення досконалого шаблону агентів, що показує силу. Поєднання векторних баз даних та графів знань для пошуку інформації, що сприяє генерації (RAG), типу того. Ми почнемо значить, з демонстрації, щоб відразу відчути силу цієї технології. Потім ми перейдемо до пояснення, чому агентський RAG і графи знань працюють саме так ефективно. Я покажу, десь так, як працює агент, і навіть поділюся з вами. Як я використовувала Claude Code, щоб створити цей чудовий шаблон. Знаєте,

Отже, давайте почнемо, десь так.

Демонстрація на Власні Очі: Швидкий Огляд Сили

Почнімо з конкретного прикладу. Я створила простий інтерфейс командного рядка, який взаємодіє з моїм агентом через API-шлюз. Цей агент, що працює за технологією агентського RAG, має доступ як. До векторної бази даних, так і до графа знань через спеціальні інструменти. Справа в тому, що він може вибирати, як саме досліджувати інформацію, що я ввела в базу даних.

Давайте подивимось, як це виглядає. Насправді,

Для моєї векторної бази даних я використовую PostgreSQL з розширенням PGVector. Більше того, це SQL-база даних, яка дозволяє зберігати вектори. Я використовую платформу десь так, Neon для PostgreSQL, яка дуже зручна. Безумовно, тут я ну, зберігаю вбудовані представлення (embeddings) для всіх, в такому дусі. Фрагментів моїх документів, як це відбувається в традиційному RAG. В даний момент у мене є лише один документ у моїй базі знань. Він стосується ініціатив великих технологічних компаній, таких як OpenAI і Microsoft. Я розбила цей документ на частини, створила їх вбудовані представлення та зберегла в Neon.

Але це ще не все! Я також створила розумієте, інформацію про компанії в графі знань, використовуючи реляційний підхід. Відверто кажучи, це розумієте, дає агенту можливість досліджувати інформацію з різних сторін. Наприклад, Amazon пов’язана з Anthropic, адже Amazon інвестувала в цю компанію. До речі, вся інфраструктура Anthropic працює на AWS. Також можна побачити, як Microsoft співпрацює з OpenAI, оскільки OpenAI використовує Azure для розміщення своїх моделей.

Це чудовий в принципі, приклад ситуації, коли корисно використовувати і векторну базу даних, і граф знань, якось так. Якщо ми хочемо проаналізувати ініціативи у сфері ІІ для великих компаній, важливо. Враховувати їхню спільну діяльність, як між Amazon та Anthropic, або OpenAI та Microsoft. Але якщо ми просто хочемо знайти інформацію про. Конкретну припустимо, компанію, наприклад, Google, краще використовувати векторну базу даних.

Саме таке мислення міститься в основі нашого агента -. Він може вирішувати, який інструмент використовувати для кожного типу питання.

Отже, ми можемо уявіть собі, поставити питання, наприклад: “Які ініціативи Google в області ІІ? ” Під капотом агент виконає пошук по векторній базі даних. Граф знань в цьому випадку не потрібен бо і ось відповідь: все виглядає чудово!

скажімо,

Давайте розглянемо ще один приклад. Я можу поставити питання про взаємозв’язок двох компаній. – те, що безумовно потребуватиме пошуку по графу знань. Наприклад: “Як пов’язані OpenAI та Microsoft? ” Хоч це і може бути просте питання, але воно показує, як агент звертається до графа. Звичайно, отже, цього разу він використовує пошук по графу, звертаючись до зв’язків. І ми отримуємо відповідь про Azure, як про єдиний. Дивно, постачальник моделей OpenAI, як ми бачили на панелі Neo4j.

І ще один приклад. Я хочу поставити питання, яке потребує використання обох типів пошуку: “Які ініціативи Microsoft та дотичність до Anthropic? ” Тут ми використовуємо як векторний пошук, так і пошук по графу. Ми спочатку шукаємо ініціативи Microsoft, а потім порівнюємо їх з Anthropic, щоб побачити можливу взаємодію.

Цей агентський RAG значить, є частиною шаблону, який я створила для вас, типу того. Технічний стек, який я використовувала, містить наступні інструменти:

Pydantic AI: фреймворк для мого ІІ-агента. Щоб було загалом, ясно, без нього ніяк, в такому дусі.
Graffiti: наша бібліотека для графа знань, що працює з Neo4j.
Neo4j: основний рушій графа знань, це інтерфейс, який ми бачили раніше з вузлами.
PostgreSQL з PGVector: значить, перетворює SQL-базу даних на векторну базу даних.
FastAPI: припустимо, для створення API-інтерфейсу агента на Python.
Claude Code: інструмент, що допоміг мені створити цього агента.

скажімо,

У кінці відео я покажу, як. Я створила цей шаблон за допомогою Claude Code. Тож не пропустіть! Насправді,

Заглиблення в Агентський RAG: Еволюція Пошуку

Сподіваюсь, з демонстрації ви. Щоб було ясно, зрозуміли, наскільки потужним є підхід з використанням агентського RAG (Retrieval-augmented generation). Простіше кажучи, але мені хочеться ще поговорити про те, як RAG еволюціонував і чому графи знань відіграють важливу роль. До речі,

У статті від Weaviate, яку я вже. Згадувала, чітко скажімо, порівнюється традиційний RAG з агентським RAG. Звичайно, я дуже ціную цю статтю, і хочу розібрати два основних підходи, зображених на схемах.

Перший підхід – значить, це так званий “ванільний RAG, десь так. “ Його ще називають наївним або класичним RAG. Процес досить простий: беремо документи, розбиваємо їх на фрагменти, використовуємо модель вбудовування, щоб створити векторне представлення інформації. Потім зберігаємо ці вектори у векторній базі даних. Насправді, коли користувач робить запит до нашого ІІ-агента, ми також пропускаємо цей запит через модель вбудовування. Це дозволяє нам знайти у векторній базі даних фрагменти документів, найбільш схожі на запитання користувача. Ці фрагменти використовуються як додатковий контекст для нашого ІІ-агента – вони стають частиною запиту до великої мовної моделі. У великої мовної моделі з’являється додаткова інформація для відповіді на запитання.

На перший погляд, все добре, але наївний RAG майже ніколи не є достатнім, тому що він надзвичайно гнучкий. Уявіть собі потік даних: запит користувача потрапляє в систему, ми створюємо його вбудоване представлення, отримуємо відповідний контекст з векторної бази даних, а потім передаємо все це великій мовній моделі. І тут виникає проблема: агент змушений використовувати цей контекст, незалежно від того, чи хоче він цього чи ні, в такому дусі. Що робити, якщо агент хоче уточнити свій пошук або провести глибше дослідження? Якщо у нас є кілька джерел знань, у агента немає можливості зробити це.

Ось тут і приходить на допомогу агентський RAG. Він дає агенту можливість розмірковувати ну, над тим, як досліджувати базу знань, а не просто примусово передавати контекст наперед, десь так. Нам дозволено визначати запити, агент може обдумувати, як він буде їх формулювати для RAG. Він може використовувати різні векторні бази даних, веб-пошук як додаткове джерело інформації.

Агенти можуть розмірковувати про те, яке джерело. Справа в тому, що використовувати, що, скажімо, на мою думку, є дуже потужним інструментом. Більше того,

Саме це ми і створили – систему з векторною базою даних та графом знань. Щоб було ясно, тепер ми можемо почати налаштовувати сам шаблон. Покажу вам, як все налаштувати, як додати документи у граф знань та векторну базу даних.

Розгортаємо Агента: Покрокова Інструкція

Я дуже рада. Представити вам ну, цей шаблон агентського RAG з графом знань. Я витратила багато часу на його створення, і зараз ви зможете його легко налаштувати. Ви отримаєте той самий агент та інтерфейс командного рядка, що бачили в демонстрації.

Усі необхідні посилання на GitHub ви знайдете в описі під цим відео.

Якщо слухайте, ви хочете створити свій проект самостійно, просто дотримуйтесь інструкцій. Процес досить простий. Безумовно, фактично,

Вимоги:

Python.
База даних PostgreSQL (наприклад, Neon, яку я використовую).
База даних Neo4j тому
API-ключ вашого постачальника LLM. Цей агент підтримує різні API-сумісні з OpenAI, такі як OpenAI, Olama для локальних LLM. До речі,

Кроки:

Створення віртуального середовища: У. Терміналі створити віртуальне середовище:
bash python -m venv. Чесно кажучи, venv
та встановити всі залежності за допомогою pip:
bash pip install -r requirements. Txt
Налаштування бази даних SQL (PostgreSQL): Потрібно підготувати базу даних SQL для зберігання векторів. Для цього ми використовуємо PostgreSQL з розширенням PGVector. Перейдіть до папки SQL та скопіюйте SQL-код з файлу. Зверніть увагу на деякі нюанси: якщо ви використовуєте іншу модель вбудовування, вам потрібно буде оновити розмірність вектора в коді. Цей SQL-файл видалить та створить заново таблиці.

Створіть безкоштовний обліковий запис на Neon (neon. Tech). Більше того, перейдіть на вкладку редактора SQL та вставте скопійований код. Запустіть SQL розумієте, код у вашій базі даних, щоб створити таблиці та розширення.
Налаштування Neo4j: Існує два способи налаштування Neo4j:
- Локальний AI пакет: Використовуємо мій пакет localAI, який містить різне безкоштовне програмне забезпечення (Neo4j, LLM) в зручному пакеті.
- Neo4j Desktop: Встановіть Neo4j Desktop за посиланням, десь так.
В обох випадках ви отримаєте ім’я. Користувача та пароль, які будуть потрібні для налаштування . Відверто кажучи, env файлу та
Налаштування . Env припустимо, файлу:
Створіть копію файлу тому env. Безумовно, example та перейменуйте її на і env. В цьому файлі треба вказати параметри для підключення. До баз даних та налаштування великих мовних моделей. Давайте пройдемося по всіх значеннях:
- DATABASE_URL: URL вашої бази даних PostgreSQL. Знайти його можна на панелі керування Neon (в розділі Connect).
- NEO4J_URI: За замовчуванням bolt://localhost:7687 бо
- NEO4J_USERNAME: Ім’я користувача для Neo4j.
- NEO4J_PASSWORD: Пароль для Neo4j.
- LLM_PROVIDER: Постачальник великої мовної моделі (OpenAI, Open Router, Olama, Gemini).
  - OPENAI_BASE_URL: Базовий URL для OpenAI, для Olama – http://localhost:11434/v1.
  - OPENAI_API_KEY: Ваш API ключ для OpenAI. Для Olama – просто Olama, в такому дусі.
- LLM_MODEL: Модель для використання. За замовчуванням GPT4 оскільки щоб було ясно, 1-Mini.
- EMBEDDING_PROVIDER: Постачальник для вбудовування (аналогічно, OpenAI, Gemini). Фактично,
  - EMBEDDING_BASE_URL: Базовий URL (OpenAI – за замовчуванням). Безумовно,
  - EMBEDDING_API_KEY: Ваш ключ хоча
  - EMBEDDING_MODEL: Модель вбудовування (наприклад, text-embedding-3-small).
- INGESTION_LLM_CHOICE: Модель, яка буде використовуватися для перетворення документів у граф знань та векторну базу даних. Зазвичай можна значно меншу модель. Я використовую GPT4. 1-nano
Відредагуйте всі ці параметри. Важливо, щоб файл , приблизно так. Env був в тому ж місцязнаходження, що і скрипти. Цікаво,
Налаштування папки з документами: Створіть папку documents. Помістіть туди ваші документи у форматі Markdown. Я надаю декілька прикладів. Ці документи будуть автоматично уявіть собі, додані у граф знань та векторну базу даних.
Запуск процесу додавання даних: Щоб додати. Дані, варто виконати наступну команду:
bash python -m ingestion. Справа в тому, що py --clean взагалі,
Прапор --clean очистить граф знань та векторну базу даних, щоб ми почали роботу з “чистого аркуша”, приблизно так. Справа в тому, що запуск цього скрипту ініціалізує зв’язок з базами даних та графом знань, десь так. Створення графа знань може бачите, зайняти деякий час, адже тут використовуються LLM для визначення сутностей та їх відносин.

Якщо ви хочете прискорити процес, можете використовувати опцію -dont_create_graph. У такому випадку граф знань не буде створюватись.
Перевірка результату: Після завершення процесу додавання даних, ви можете перевірити їх наявність в базі даних PostgreSQL (у розділі Tables) та в Neo4j (за допомогою запитів Cypher). Насправді,
Налаштування поведінки агента: Перейдіть у папку agent та відкрийте файл prompts. Py але це основний системний промт, який використовує агент. Тут визначаються інструкції щодо використання різних можливостей агента (пошук по векторній базі даних, графу знань). Також вказується, як використовувати ці інструменти. Зрозуміло, наприклад, я вказала використання графа знань лише тоді, коли користувач запитує про дві компанії одночасно. В іншому припустимо, випадку буде використовуватися векторна база даних. Ви можете змінити цей системний промт відповідно до ваших потреб.
Запуск API сервера: Запустіть API-сервер. За допомогою команди:
bash python -m agent. Звичайно, api
припустимо,
Взаємодія з агентом через інтерфейс командного рядка: Відкрийте другий термінал. Перейдіть у папку, що містить проєкт, та запустіть скрипт:
bash python CLI. Очевидно, py
Спробуйте задати питання, як ми робили в демонстрації.

Все готово!

Додаткові Команди

Ось декілька корисних команд для роботи з. Інтерфейсом командного рядка:

exit або quit: завершити роботу з агентом. Приблизно, Зрозуміло,
help: отримати довідку.

Як Працює Агент: Глибинна Робота

Агент використовує різні компоненти для. До речі, виконання поставлених задач:

Pydantic AI: Фреймворк для структуризації та керування агентом.

скажімо,

Graffiti: Для створення та управління графом знань.
PostgreSQL з PGVector: Для зберігання векторних даних.
FastAPI: Для створення API інтерфейсу.
Великі мовні моделі (LLM): Для обробки запитів, аналізу даних та генерації відповідей.

Агент використовує різні інструменти:

Пошук по. Векторній базі даних: Для пошуку інформації на основі схожості векторів. Чесно кажучи,
Пошук по графу знань: Для аналізу взаємозв’язків між сутностями.
Інструменти для роботи з API: Можуть бути додані інші корисні інструменти (наприклад, пошук в інтернеті).

Використання Claude Code для Створення Агента: За Лаштунками

я хочу поділитися з вами, як я використовувала Claude Code для створення цього потужного агентського RAG. Справа в тому, що звісно, це окрема тема, про яку я планую розповісти більш детально.

Мій процес включає наступне:

Документація: Моїм AI помічником були використані MCP сервери (Model Control Plane). Фактично,
- Crawling for RAG: для завантаження зовнішньої документації.
- Neon: для управління базою даних PostgreSQL.
Режим планування в Claude Code: Клавішами Shift+Tab перемикаємось у режим планування, де ми можемо описати загальну структуру проєкту та список необхідних задач.

бачите,
- planning оскільки md: опис архітектури.
- task оскільки md: детальний список задач.
- claw. Md: глобальні правила для Claude Code, містить інструкції щодо використання planning. Md, task хоча md, MCP серверів.
Перехід в режим побудови: Після створення цих файлів, повертаємось в режим побудови (Shift+Tab). Насправді, claude Code використовує planning. Md та task але md для автоматичного створення коду та налаштування.
Одобрюємо запропоновані дії: Періодично необхідно. Перевіряти та скажімо, схвалювати дії, що запропоновані Claude Code.
Використання прикладів: Для кращого ну, розуміння, Claude Code може використовуватись приклади з папки examples.

наприклад,

Саме так я створила цього агента. До речі, існують готові файли: planning. Md, claw. Md, task. Md проте Їх можна знайти на GitHub. Ви можете використовувати їх для власного проєкту.

Я сподіваюся, що цей відео-огляд та шаблон. Агентського RAG з графом знань виявились вам корисними, приблизно так. Якщо так, поставте лайк та підпишіться на канал. До речі, залишайтесь на начебто, зв’язку, аби не пропускати нові відео. До зустрічі!

AI 2026: Чи Готові Ми до Ери Цифрових Супергероїв Google?

ШІ говорить SQL: Революція в аналізі даних

Чи настав час вірити в AGI? Розбираємо заяву Integral AI та роздуми про майбутнє штучного інтелекту.

AI 2026: Чи Готові Ми до Ери Цифрових Супергероїв Google?

ШІ говорить SQL: Революція в аналізі даних

Чи настав час вірити в AGI? Розбираємо заяву Integral AI та роздуми про майбутнє штучного інтелекту.

Популярні

Мистецтво майбутнього: 50 креативних стилів генерації зображень з ChatGPT та Sora

Від нуля до майстерності: Подорож у світ автоматизації з N8N

Клод 4: ШІ, який мислить, відчуває та ставить під сумнів реальність

Підпишіться

З’єднання Разом: Агентський RAG та Графи Знань – Ваш Шлях до Ефективного Пошуку у Світі ІІ

З’єднання Разом: Як скажімо, ІІ-Агенти та Графи Знань Перетворюють Пошук Інформації

Демонстрація на Власні Очі: Швидкий Огляд Сили

Заглиблення в Агентський RAG: Еволюція Пошуку

Розгортаємо Агента: Покрокова Інструкція

Додаткові Команди

Як Працює Агент: Глибинна Робота

Використання Claude Code для Створення Агента: За Лаштунками

Пов’язані повідомлення

Підпишіться на оновлення