Ограничения и расход токенов ИИ-агента

ИИ-агент — это технология, у которой есть стоимость. Каждый ответ агента — это запрос к языковой модели, который тратит токены.

Что такое токен

Токен — это «единица» текста для языковой модели. Примерно:

1 короткое слово на русском = 2–3 токена;
1 длинное предложение = 30–50 токенов;
1 страница (А4) = около 500–700 токенов.

Когда клиент задаёт вопрос, в модель отправляется:

системная инструкция агента (тон, правила);
релевантные куски из ваших источников;
история текущего диалога;
сам вопрос клиента.

В ответ модель пишет текст — это тоже токены.

Полная цепочка одного ответа агента — примерно 1000–3000 токенов. Подробнее про токены — в статье «Что такое токены ИИ».

Сколько включено в тариф

ИИ-агенты работают только на тарифе Премиум. В тариф включено 500 ИИ-токенов в месяц. На триальном Премиуме (7 дней) — 30 ИИ-токенов на весь триал.

Когда пакет израсходован, ИИ-агент временно отключается и сообщения идут к оператору (или к стандартному сценарию). Чтобы продолжить — докупите токены (1.25 ₽ за токен) или дождитесь следующего расчётного периода. Докупленные токены переносятся на следующий месяц, пока подписка активна.

Точные размеры пакета — в карточке тарифа «Тарифы Free, Plus, Premium».

Как сэкономить токены

Делайте источники короче и точнее

Каждый раз при ответе агент «подгружает» куски из источников. Чем короче и яснее ваши документы — тем меньше токенов уходит.

Хорошо: PDF на 5 страниц с FAQ и прайсом.
Плохо: PDF на 80 страниц с договором, регламентами и приложениями (большую часть из которых клиент никогда не спросит).

Сократите системную инструкцию

Если в «Поведении» агента 30 абзацев правил — это много токенов на каждый вопрос. Сократите до 5–10 ключевых правил.

Ограничьте длину ответов

В настройках агента можно указать стиль ответов (см. статью «Тон и стиль»). Если установить «короткие ответы по 1–2 предложения» — экономия 30–50% токенов.

Используйте сценарии для частых вопросов

Если у вас 90% клиентов спрашивают «сколько стоит?» — сделайте обычный сценарий с ключевым словом «цена», который сразу присылает прайс. Это бесплатно (не тратит токенов). ИИ оставьте для нестандартных вопросов.

Где посмотреть расход

В кабинете → «Тарифы и баланс» → раздел «Токены». Там видно:

Включено в тариф этого периода.
Израсходовано (со счётчиком до конца периода).
Оставшийся остаток.

Если осталось мало — система пришлёт уведомление.

Что делать, если токены закончились

Докупить. В разделе «Тарифы и баланс» можно купить дополнительный пакет.
Перейти на более крупный тариф. Если регулярно превышаете — выгоднее перейти на Plus или Premium с большим пакетом.
Отключить ИИ временно. В карточке агента → «Отключить». Тогда клиенты пойдут к оператору или по обычным сценариям.

Какие модели мы используем

Под капотом — современные большие языковые модели (LLM). Конкретный поставщик может меняться, и в редких случаях мы перенастраиваем модели — но для пользователя это незаметно. Качество ответов не падает.