Файлы — основной способ загрузить в ИИ-агента знания о вашем продукте, услугах, регламентах и FAQ.
Какие форматы поддерживаются
- PDF — извлекаем текст из PDF.
- DOCX — Microsoft Word.
- TXT — обычный текстовый файл.
- MD / Markdown — текстовые заметки с разметкой Markdown.
Как загрузить
В карточке агента → «Обучение ИИ» → «Источники» → «Добавить файл». Перетащите файл или выберите его с компьютера. После загрузки источник появится в списке.
Что важно знать про PDF
ИИ-агент извлекает из PDF текстовый слой. Если ваш PDF — это скан страниц (например, отсканированный документ или книга), текст в нём отсутствует, и агент не сможет ничего из него прочитать.
[!warning] Сканы и фото Сначала прогоните скан через OCR (распознавание текста). Подойдёт любой онлайн-сервис распознавания: загружаете PDF, получаете «текстовый» PDF. Только после этого загружайте в ИИ-агента.
Проверить, есть ли в PDF текст просто — попробуйте выделить мышкой слово в любом PDF-просмотрщике. Если выделяется — текстовый слой есть. Если нельзя выделить — это картинка.
Что важно знать про DOCX
Word-файлы извлекаем целиком, включая абзацы, списки и таблицы. Но не извлекаем:
- Заголовки и колонтитулы (в большинстве случаев).
- Текст в картинках (то же самое, что со сканами).
- Текст в SmartArt-схемах и диаграммах.
Поэтому если в документе важная информация в виде картинок/схем — продублируйте её обычным текстом ниже.
Размер файла
- До 10 МБ на файл — оптимально.
- Большие документы (50–100 страниц) лучше разбить на несколько файлов по темам: «Каталог.pdf», «Доставка.pdf», «Гарантия.pdf». Так агенту проще находить релевантные куски.
Как агент использует файлы
Когда клиент задаёт вопрос, агент:
- Ищет в загруженных файлах куски текста, релевантные вопросу.
- Берёт найденные куски и формулирует ответ на их основе.
Это значит, что формулировки в файлах должны быть простыми и понятными. Если в документе написано «Возврат осуществляется в соответствии с пунктом 3.4 регламента» — агент так и ответит. Если написано «Вернуть товар можно в течение 14 дней, если он не использовался» — агент ответит так же по-человечески.
Хорошие файлы для базы знаний
- FAQ. «Часто задаваемые вопросы. Вопрос: ... Ответ: ...»
- Каталог. Список товаров/услуг с краткими описаниями и ценами.
- Регламенты. Доставка, оплата, возврат, гарантия — переписанные простыми словами.
- Описание компании. Кто мы, что делаем, чем отличаемся.
Плохие файлы
- Договор оферты на 30 страниц юридическим языком.
- Прайс-лист в формате Excel-таблицы — конвертируйте в DOCX или TXT, иначе агент путается в строках.
- Скан паспорта (это не нужно ИИ и нарушает приватность).
Обновление файла
Если ваш каталог или прайс изменился — удалите старый файл и загрузите новый. Просто заменить файл «поверх» нельзя: каждый файл — отдельный источник.
Сколько файлов оптимально
5–20 файлов с понятными названиями. Если файлов больше 30 — это уже сложно поддерживать. Лучше «склейте» несколько в один, объединив по теме.