OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Аварийное переключение

Механизм аварийного переключения OfoxAI автоматически переходит на резервную модель при недоступности основной, обеспечивая непрерывность вашего сервиса.

Принцип работы

Запрос отправляется на основную модель
Если основная модель возвращает ошибку (5xx, таймаут, ограничение скорости и т.д.)
Автоматически последовательно пробуются модели из списка fallback
Возвращается первый успешный ответ

Переключение по запросу

Настройте аварийное переключение для отдельного запроса через параметр provider.fallback:

fallback.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<Ваш OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",  # основная модель
    messages=[{"role": "user", "content": "Здравствуйте"}],
    extra_body={
        "provider": {
            "fallback": [
                "anthropic/claude-sonnet-4.5",  # первый резервный
                "google/gemini-3-flash-preview"              # второй резервный
            ]
        }
    }
)
 
# Проверить фактически использованную модель
print(response.model)

fallback.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: 'Здравствуйте' }],
  // @ts-ignore расширенные параметры OfoxAI
  provider: {
    fallback: [
      'anthropic/claude-sonnet-4.5',
      'google/gemini-3-flash-preview'
    ]
  }
})

Глобальная настройка переключения

Настройте глобальную стратегию переключения в консоли OfoxAI без необходимости указывать её в каждом запросе:

Войдите в консоль OfoxAI
Перейдите в Настройки → Стратегия маршрутизации
Настройте список резервных моделей по умолчанию

Параметр fallback на уровне отдельного запроса переопределяет глобальную конфигурацию.

Условия активации переключения

Следующие ситуации активируют переключение:

Условие	Описание
HTTP 5xx	Ошибка сервера
Таймаут	Превышение времени ожидания ответа модели
429 ограничение	Достигнут лимит скорости у вышестоящей модели
Модель недоступна	Обслуживание или отключение провайдера

Следующие ситуации не активируют переключение:

Условие	Описание
HTTP 4xx (кроме 429)	Ошибка клиента — необходимо исправить запрос
Фильтрация контента	Модель отклонила генерацию контента

Использование с маршрутизацией

Механизм переключения можно комбинировать с маршрутизацией провайдеров:


response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Здравствуйте"}],
    extra_body={
        "provider": {
            "routing": "latency",    # маршрутизация по минимальной задержке
            "fallback": [             # список резервных моделей
                "anthropic/claude-sonnet-4.5",
                "google/gemini-3-flash-preview"
            ]
        }
    }
)

Лучшие практики

Выбирайте резервные модели с сопоставимыми возможностями — для обеспечения стабильного качества вывода после переключения
Переключайтесь между провайдерами — чтобы избежать одновременной недоступности моделей одного провайдера
Задавайте 2-3 резервные модели — этого достаточно для большинства сценариев сбоя
Мониторьте частоту переключений — частые переключения могут указывать на необходимость смены основной модели

Аварийное переключение

Принцип работы

Переключение по запросу

Глобальная настройка переключения

Условия активации переключения

Использование с маршрутизацией

Рекомендуемые сценарии переключения

Общий диалог

Генерация кода

Экономичность

Лучшие практики