OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Failover

O mecanismo de failover do OfoxAI troca automaticamente para um modelo alternativo quando o modelo principal está indisponível, garantindo que o seu serviço não seja interrompido.

Como funciona

A requisição é enviada ao modelo principal
Se o modelo principal retornar um erro (5xx, timeout, limitação de taxa etc.)
os modelos da lista de fallback são tentados sequencialmente
A primeira resposta bem-sucedida é retornada

Fallback por requisição

Configure o fallback para uma requisição individual usando o parâmetro provider.fallback:

fallback.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<Sua OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",  # Modelo principal
    messages=[{"role": "user", "content": "Olá"}],
    extra_body={
        "provider": {
            "fallback": [
                "anthropic/claude-sonnet-4.5",  # Primeira alternativa
                "google/gemini-3-flash-preview"              # Segunda alternativa
            ]
        }
    }
)
 
# Verificar o modelo efetivamente utilizado
print(response.model)

fallback.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: 'Olá' }],
  // @ts-ignore Parâmetro de extensão OfoxAI
  provider: {
    fallback: [
      'anthropic/claude-sonnet-4.5',
      'google/gemini-3-flash-preview'
    ]
  }
})

Configuração global de fallback

Configure uma estratégia global de fallback no painel do OfoxAI, sem precisar especificar em cada requisição:

Faça login no Painel OfoxAI
Acesse Configurações → Estratégia de roteamento
Configure a lista padrão de modelos de fallback

O parâmetro fallback no nível da requisição sobrepõe a configuração global.

Condições de ativação

As seguintes situações ativam o fallback:

Condição	Descrição
HTTP 5xx	Erro do servidor
Timeout	Tempo de resposta do modelo esgotado
429 Throttle	Limite de taxa atingido no modelo upstream
Modelo indisponível	Manutenção ou desativação pelo provedor

As seguintes situações não ativam o fallback:

Condição	Descrição
HTTP 4xx (exceto 429)	Erros do cliente exigem correção na requisição
Filtragem de conteúdo	Conteúdo recusado pelo modelo

Combinação com roteamento

O mecanismo de fallback pode ser combinado com o roteamento de provedores:


response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Olá"}],
    extra_body={
        "provider": {
            "routing": "latency",    # Roteamento otimizado por latência
            "fallback": [             # Lista de fallback
                "anthropic/claude-sonnet-4.5",
                "google/gemini-3-flash-preview"
            ]
        }
    }
)

Cenários recomendados de fallback

Conversação geral


"provider": {
    "fallback": ["anthropic/claude-sonnet-4.5", "google/gemini-3-flash-preview"]
}

Geração de código


"provider": {
    "fallback": ["anthropic/claude-sonnet-4.5", "deepseek/deepseek-chat"]
}

Melhor custo-benefício


"provider": {
    "fallback": ["openai/gpt-4o-mini", "google/gemini-3-flash-preview", "deepseek/deepseek-chat"]
}

Boas práticas

Escolha modelos alternativos com capacidade semelhante — Para manter a qualidade das respostas após o fallback
Configure fallback entre provedores diferentes — Evite que modelos do mesmo provedor fiquem indisponíveis simultaneamente
Defina 2 a 3 alternativas — Suficiente para a maioria dos cenários de falha
Monitore a frequência de fallback — Fallbacks frequentes podem indicar a necessidade de trocar o modelo principal