OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Roteamento de provedores

O OfoxAI suporta uma arquitetura multi-provedor, onde o mesmo modelo pode ser fornecido por diferentes nós de provedores. Através de estratégias de roteamento, você controla como as requisições são distribuídas.

Estratégias de roteamento

Estratégia	Descrição	Cenário de uso
`priority`	Por ordem de prioridade (padrão)	Prioridade para estabilidade
`cost`	Menor custo primeiro	Processamento em lote, cenários sensíveis a custo
`latency`	Menor latência primeiro	Diálogos em tempo real, interação com usuário
`balanced`	Balanceamento de carga	Cenários de alta concorrência

Como usar

Configure a estratégia de roteamento através do parâmetro de extensão provider.routing:

routing.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<Sua OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Olá"}],
    extra_body={
        "provider": {
            "routing": "cost"  # Menor custo primeiro
        }
    }
)

routing.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: 'Olá' }],
  // @ts-ignore Parâmetro de extensão OfoxAI
  provider: {
    routing: 'cost'
  }
})

Estratégias em detalhe

`priority` — Roteamento por prioridade (padrão)

Distribui requisições na ordem de prioridade predefinida pelo OfoxAI. Prioriza os nós mais estáveis.

`cost` — Otimização de custo

Seleciona automaticamente o nó do provedor com o menor custo atual. Adequado para processamento em lote, anotação de dados e outros cenários tolerantes a latência.

`latency` — Otimização de latência

Seleciona o nó do provedor com a menor latência de resposta. Adequado para cenários de diálogo em tempo real que exigem respostas rápidas.

`balanced` — Balanceamento de carga

Distribui requisições uniformemente entre todos os nós de provedores disponíveis. Adequado para cenários de alta concorrência, evitando sobrecarga em um único nó.

Boas práticas

Diálogos em tempo real com latency — Menor tempo de espera para o usuário
Tarefas em lote com cost — Reduzir custos totais
Ambientes de produção com priority por padrão — Garantir estabilidade
Combinar com failover — Estratégias de roteamento podem ser combinadas com o parâmetro fallback

Você também pode definir uma estratégia de roteamento padrão global no painel do OfoxAI, sem precisar especificar em cada requisição.