OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Enrutamiento de proveedores

OfoxAI soporta una arquitectura multi-proveedor donde el mismo modelo puede ser servido a través de diferentes nodos de proveedores. Mediante estrategias de enrutamiento, puede controlar cómo se distribuyen las solicitudes.

Estrategias de enrutamiento

Estrategia	Descripción	Caso de uso
`priority`	Por orden de prioridad (predeterminado)	Prioridad a la estabilidad
`cost`	Prioridad al menor costo	Procesamiento por lotes, sensible al costo
`latency`	Prioridad a la menor latencia	Conversación en tiempo real, interacción con el usuario
`balanced`	Balanceo de carga	Escenarios de alta concurrencia

Modo de uso

Configure la estrategia de enrutamiento mediante el parámetro extendido provider.routing:

routing.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<su OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Hola"}],
    extra_body={
        "provider": {
            "routing": "cost"  # Prioridad al menor costo
        }
    }
)

routing.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: 'Hola' }],
  // @ts-ignore Parámetro extendido de OfoxAI
  provider: {
    routing: 'cost'
  }
})

Detalle de estrategias

`priority` — Enrutamiento por prioridad (predeterminado)

Distribuye las solicitudes según el orden de prioridad preestablecido por OfoxAI. Usa preferentemente los nodos con mayor estabilidad.

`cost` — Prioridad al costo

Selecciona automáticamente el nodo del proveedor con menor costo actual. Ideal para procesamiento por lotes, etiquetado de datos y otros escenarios donde la latencia no es crítica.

`latency` — Prioridad a la latencia

Selecciona el nodo del proveedor con menor latencia de respuesta. Ideal para escenarios de conversación en tiempo real que requieren respuestas rápidas.

`balanced` — Balanceo de carga

Distribuye las solicitudes de manera uniforme entre todos los nodos de proveedores disponibles. Ideal para escenarios de alta concurrencia, evitando la sobrecarga de un solo punto.

Mejores prácticas

Conversación en tiempo real — use latency para menor tiempo de espera del usuario
Tareas por lotes — use cost para reducir el costo total
Entorno de producción — use priority por defecto para garantizar la estabilidad
Combine con respaldo — Las estrategias de enrutamiento se pueden combinar con el parámetro fallback

También puede configurar una estrategia de enrutamiento global predeterminada en la consola de OfoxAI, sin necesidad de especificarla en cada solicitud.