OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Интеллектуальная маршрутизация моделей

Интеллектуальная маршрутизация моделей OfoxAI автоматически выбирает лучшую модель для вашего запроса, оптимизируя по стоимости, скорости, качеству и другим параметрам.

Режим Auto

Самый простой способ использования — установить model: "auto" и позволить OfoxAI выбрать автоматически:


response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "Объясните квантовые вычисления"}]
)
 
# Проверить фактически использованную модель
print(response.model)  # например "openai/gpt-4o"

Режим Auto автоматически выбирает наиболее подходящую модель на основе сложности запроса и состояния доступных моделей.

Настройка пула моделей

Вы можете указать пул кандидатных моделей и предпочтения маршрутизации:

model_routing.py


response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "Помоги оптимизировать этот код"}],
    extra_body={
        "model_routing_config": {
            "models": [
                "openai/gpt-4o",
                "anthropic/claude-sonnet-4.5",
                "google/gemini-3-flash-preview"
            ],
            "preference": "quality"  # приоритет качества
        }
    }
)

Предпочтения маршрутизации

Предпочтение	Описание
`balanced`	Баланс качества, скорости и стоимости (по умолчанию)
`quality`	Приоритет качества — выбирается самая мощная модель
`speed`	Приоритет скорости — выбирается самая быстрая модель
`cost`	Приоритет стоимости — выбирается самая дешёвая модель

Сценарии использования

Оптимизация затрат

Для простых диалогов автоматически используются дешёвые модели; для сложных задач — мощные модели:


# Простой сценарий → возможен выбор gpt-4o-mini или gemini-3-flash-preview
response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "Какой сегодня день недели?"}],
    extra_body={"model_routing_config": {"preference": "cost"}}
)

Высокая доступность

Укажите несколько резервных моделей для обеспечения бесперебойной работы:


response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "Проанализируйте рыночные тренды"}],
    extra_body={
        "model_routing_config": {
            "models": [
                "openai/gpt-4o",
                "anthropic/claude-sonnet-4.5",
                "google/gemini-3.1-pro-preview"
            ],
            "preference": "balanced"
        }
    }
)

Интеллектуальная маршрутизация автоматически отслеживает состояние каждой модели в реальном времени (задержка, доступность, нагрузка) и делает оптимальный выбор из пула кандидатов.