База знаний· ИИ-агенты· Внешние источники: сайт и файлы

ИИ-агенты

Внешние источники: сайт и файлы

Как подключить к ИИ-агенту страницу сайта или загрузить документ, чтобы агент отвечал по ним.

Кроме «Рассказа о себе» и пар «вопрос-ответ», ИИ-агент умеет читать внешние источники — текстовое содержимое страницы вашего сайта или загруженный документ. Это удобно, когда у вас есть готовая длинная информация (договор, инструкция, статья на сайте), и не хочется переписывать её вручную в «Рассказ».

Какие источники поддерживаются

Два типа:

  • Страница сайта — указываете URL, мы скачиваем её текст и подкладываем агенту.
  • Файл — PDF, DOCX, TXT, MD/Markdown. Подходит для регламентов, договоров, инструкций.

Google Sheets, CRM, API

Подключения к Google Sheets и сторонним API в качестве «базы знаний» агента нет. Подобные данные нужно либо вручную перенести в «Рассказ»/Q&A, либо выгрузить в виде статичного документа и загрузить как файл.

Когда это нужно

  • Договор-оферта. Загрузили PDF — агент видит, что написано в каждом пункте.
  • Длинная страница «О компании». Привязали URL — агент не «забудет» детали.
  • Инструкция в DOCX. Удобно, когда инструкция уже есть и постоянно обновляется на стороне отдела.

Когда не нужно

  • Если данные меняются раз в неделю и чаще — лучше держать их в «Рассказе» (или в Q&A), их быстрее править вручную.
  • Если данные закрытые (нет публичной ссылки) и нет возможности выгрузить в PDF/DOCX.

Как добавить источник

  1. Откройте ИИ-агента (раздел «ИИ-агенты» → нужный агент).
  2. Перейдите на вкладку «Обучение ИИ».
  3. На шаге «Источники» — кнопка «Добавить источник».
  4. Выберите тип:
  • Ссылка — вставьте URL страницы.
  • Файл — перетащите файл (PDF, DOCX, TXT, MD/Markdown).
  1. Готово. Через минуту-две агент уже использует этот источник в ответах.

Сайт: что мы скачиваем

Мы скачиваем основной текст страницы и чистим его от навигации, футера и рекламы. Поэтому работает только с обычными «текстовыми» страницами. Если страница рендерится только JavaScript-ом (контент появляется в браузере уже после загрузки) — мы можем не увидеть текст.

Файл: размер и формат

  • Допустимые форматы: PDF, DOCX, TXT, MD/Markdown.
  • Размер — до нескольких мегабайт.
  • Файл «статичный»: если документ изменился — удалите старый и загрузите новый.

Как агент использует источники

Когда клиент задаёт вопрос, агент сначала смотрит «Рассказ о себе» и пары Q&A. Если там нет — пользуется содержимым источников. Например, клиент спрашивает «А есть пункт об отказе в договоре?» — агент находит нужное место в загруженном PDF и отвечает.

Тестирование

В тест-чате задавайте вопросы, ответ на которые есть только в источнике, и смотрите, тянет ли он:

  • «Что написано в пункте 4.3 договора?» (PDF-договор).
  • «Что вы рассказываете в разделе «О нас» на сайте?» (URL).

Если агент отвечает «не знаю»:

  • Источник ещё не обработался — подождите 5–10 минут.
  • В источнике нет нужной информации — проверьте сам источник.
  • Файл слишком большой или плохо распознан — попробуйте разбить на несколько файлов поменьше.

Ограничения

  • Источников на одного агента — несколько, но без перебора: больше десятка обычно не нужно.
  • Если страница защищена авторизацией — мы её не увидим. Сделайте отдельную публичную страницу или загрузите содержимое файлом.
  • Сайты, где контент рендерится только JavaScript-ом — могут не читаться.

Пример: рабочая связка

Школа танцев:

  • «Рассказ о себе» — кто мы, как проходит занятие, общие условия.
  • Пары Q&A — 30 самых частых вопросов и ответов.
  • Файл «Договор» (PDF) — публичная оферта.
  • Ссылка на страницу example.com/about — расширенное описание.

Клиент пишет «А что в договоре про отмену?» — агент читает PDF и отвечает.

Что не использовать как источник

  • Сторис, посты в соцсетях — мы не умеем их скачивать.
  • Закрытые корпоративные базы (Notion, Confluence в частном пространстве) — нет.
  • Видео и аудио — нет распознавания речи в источниках.

Не нашли ответ?

Напишите в поддержку — подскажем по шагам в рабочее время.