База знаний· ИИ-агенты· Ограничения и расход токенов ИИ-агента

ИИ-агенты

Ограничения и расход токенов ИИ-агента

Сколько «думает» ИИ-агент, что входит в тариф и как контролировать расходы.

ИИ-агент — это технология, у которой есть стоимость. Каждый ответ агента — это запрос к языковой модели, который тратит токены.

Что такое токен

Токен — это «единица» текста для языковой модели. Примерно:

  • 1 короткое слово на русском = 2–3 токена;
  • 1 длинное предложение = 30–50 токенов;
  • 1 страница (А4) = около 500–700 токенов.

Когда клиент задаёт вопрос, в модель отправляется:

  • системная инструкция агента (тон, правила);
  • релевантные куски из ваших источников;
  • история текущего диалога;
  • сам вопрос клиента.

В ответ модель пишет текст — это тоже токены.

Полная цепочка одного ответа агента — примерно 1000–3000 токенов. Подробнее про токены — в статье «Что такое токены ИИ».

Сколько включено в тариф

ИИ-агенты работают только на тарифе Премиум. В тариф включено 500 ИИ-токенов в месяц. На триальном Премиуме (7 дней) — 30 ИИ-токенов на весь триал.

Когда пакет израсходован, ИИ-агент временно отключается и сообщения идут к оператору (или к стандартному сценарию). Чтобы продолжить — докупите токены (1.5 ₽ за токен) или дождитесь следующего расчётного периода. Докупленные токены переносятся на следующий месяц, пока подписка активна.

Точные размеры пакета — в карточке тарифа «Тарифы Free, Plus, Premium».

Как сэкономить токены

Делайте источники короче и точнее

Каждый раз при ответе агент «подгружает» куски из источников. Чем короче и яснее ваши документы — тем меньше токенов уходит.

  • Хорошо: PDF на 5 страниц с FAQ и прайсом.
  • Плохо: PDF на 80 страниц с договором, регламентами и приложениями (большую часть из которых клиент никогда не спросит).

Сократите системную инструкцию

Если в «Поведении» агента 30 абзацев правил — это много токенов на каждый вопрос. Сократите до 5–10 ключевых правил.

Ограничьте длину ответов

В настройках агента можно указать стиль ответов (см. статью «Тон и стиль»). Если установить «короткие ответы по 1–2 предложения» — экономия 30–50% токенов.

Используйте сценарии для частых вопросов

Если у вас 90% клиентов спрашивают «сколько стоит?» — сделайте обычный сценарий с ключевым словом «цена», который сразу присылает прайс. Это бесплатно (не тратит токенов). ИИ оставьте для нестандартных вопросов.

Где посмотреть расход

В кабинете → «Тарифы и баланс» → раздел «Токены». Там видно:

  • Включено в тариф этого периода.
  • Израсходовано (со счётчиком до конца периода).
  • Оставшийся остаток.

Если осталось мало — система пришлёт уведомление.

Что делать, если токены закончились

  • Докупить. В разделе «Тарифы и баланс» можно купить дополнительный пакет.
  • Перейти на более крупный тариф. Если регулярно превышаете — выгоднее перейти на Plus или Premium с большим пакетом.
  • Отключить ИИ временно. В карточке агента → «Отключить». Тогда клиенты пойдут к оператору или по обычным сценариям.

Какие модели мы используем

Под капотом — современные большие языковые модели (LLM). Конкретный поставщик может меняться, и в редких случаях мы перенастраиваем модели — но для пользователя это незаметно. Качество ответов не падает.

Ограничения

  • Один ответ агента — до ~2000 знаков. Длиннее модели физически не могут (это ограничение технологии).
  • Контекст диалога — около десятка последних сообщений. Очень длинная история частично «забывается». Если важная деталь была давно — лучше повторно её спросить или зафиксировать в карточке клиента.
  • Источники — суммарно до 10–20 МБ текста. Больше можно, но качество поиска по источникам начнёт падать. Лучше «склеить» источники по теме.

Не нашли ответ?

Напишите в поддержку — подскажем по шагам в рабочее время.