Skip to Content

Тарификация

OfoxAI использует модель чистой оплаты по потреблению — платите только за то, что используете. Никаких подписок, тарифных планов, ежемесячных платежей или минимальных расходов.

Без подписок, тарифных планов и скрытых платежей. Пополнили — пользуйтесь, баланс не сгорает.

Способ тарификации

Текстовые модели (оплата за токены)

Статья расходовОписание
Input TokensТокены, потреблённые при вводе (prompt)
Output TokensТокены, потреблённые при выводе (completion)
Cached TokensВходные токены из кэша (по сниженной цене)

Другие модели

ТипСпособ оплаты
Генерация изображенийОплата за количество изображений
EmbeddingsОплата по входным токенам

Порядок использования

  1. Регистрация — перейдите в консоль OfoxAI  и зарегистрируйтесь
  2. Пополнение — пополните баланс по мере необходимости, средства не сгорают
  3. Использование — оплата по фактическому потреблению в реальном времени

Просмотр расходов

Консоль

  1. Войдите в консоль OfoxAI 
  2. Перейдите на страницу Биллинг
  3. Просматривайте детализацию расходов в реальном времени с разбивкой по моделям и датам

Ответ API

Каждый ответ API содержит поле usage для удобного отслеживания потребления:

{ "usage": { "prompt_tokens": 100, "completion_tokens": 50, "total_tokens": 150 } }

Рекомендации по оптимизации затрат

  1. Выбирайте подходящую модель — для простых задач используйте лёгкие модели, не обязательно использовать флагманскую модель для всех сценариев
  2. Включите Prompt Caching — повторяющиеся system prompt могут сэкономить 50-90% затрат на ввод
  3. Контролируйте max_tokens — установите разумные ограничения на длину вывода, избегая лишнего потребления токенов
  4. Объединяйте запросы — объединение нескольких коротких запросов в один уменьшает накладные расходы на повторяющийся prompt

Актуальные цены на модели см. в Каталоге моделей .

Last updated on