ИИ-агент — это технология, у которой есть стоимость. Каждый ответ агента — это запрос к языковой модели, который тратит токены.
Что такое токен
Токен — это «единица» текста для языковой модели. Примерно:
- 1 короткое слово на русском = 2–3 токена;
- 1 длинное предложение = 30–50 токенов;
- 1 страница (А4) = около 500–700 токенов.
Когда клиент задаёт вопрос, в модель отправляется:
- системная инструкция агента (тон, правила);
- релевантные куски из ваших источников;
- история текущего диалога;
- сам вопрос клиента.
В ответ модель пишет текст — это тоже токены.
Полная цепочка одного ответа агента — примерно 1000–3000 токенов. Подробнее про токены — в статье «Что такое токены ИИ».
Сколько включено в тариф
ИИ-агенты работают только на тарифе Премиум. В тариф включено 500 ИИ-токенов в месяц. На триальном Премиуме (7 дней) — 30 ИИ-токенов на весь триал.
Когда пакет израсходован, ИИ-агент временно отключается и сообщения идут к оператору (или к стандартному сценарию). Чтобы продолжить — докупите токены (1.5 ₽ за токен) или дождитесь следующего расчётного периода. Докупленные токены переносятся на следующий месяц, пока подписка активна.
Точные размеры пакета — в карточке тарифа «Тарифы Free, Plus, Premium».
Как сэкономить токены
Делайте источники короче и точнее
Каждый раз при ответе агент «подгружает» куски из источников. Чем короче и яснее ваши документы — тем меньше токенов уходит.
- Хорошо: PDF на 5 страниц с FAQ и прайсом.
- Плохо: PDF на 80 страниц с договором, регламентами и приложениями (большую часть из которых клиент никогда не спросит).
Сократите системную инструкцию
Если в «Поведении» агента 30 абзацев правил — это много токенов на каждый вопрос. Сократите до 5–10 ключевых правил.
Ограничьте длину ответов
В настройках агента можно указать стиль ответов (см. статью «Тон и стиль»). Если установить «короткие ответы по 1–2 предложения» — экономия 30–50% токенов.
Используйте сценарии для частых вопросов
Если у вас 90% клиентов спрашивают «сколько стоит?» — сделайте обычный сценарий с ключевым словом «цена», который сразу присылает прайс. Это бесплатно (не тратит токенов). ИИ оставьте для нестандартных вопросов.
Где посмотреть расход
В кабинете → «Тарифы и баланс» → раздел «Токены». Там видно:
- Включено в тариф этого периода.
- Израсходовано (со счётчиком до конца периода).
- Оставшийся остаток.
Если осталось мало — система пришлёт уведомление.
Что делать, если токены закончились
- Докупить. В разделе «Тарифы и баланс» можно купить дополнительный пакет.
- Перейти на более крупный тариф. Если регулярно превышаете — выгоднее перейти на Plus или Premium с большим пакетом.
- Отключить ИИ временно. В карточке агента → «Отключить». Тогда клиенты пойдут к оператору или по обычным сценариям.
Какие модели мы используем
Под капотом — современные большие языковые модели (LLM). Конкретный поставщик может меняться, и в редких случаях мы перенастраиваем модели — но для пользователя это незаметно. Качество ответов не падает.
Ограничения
- Один ответ агента — до ~2000 знаков. Длиннее модели физически не могут (это ограничение технологии).
- Контекст диалога — около десятка последних сообщений. Очень длинная история частично «забывается». Если важная деталь была давно — лучше повторно её спросить или зафиксировать в карточке клиента.
- Источники — суммарно до 10–20 МБ текста. Больше можно, но качество поиска по источникам начнёт падать. Лучше «склеить» источники по теме.