Skip to Content

Respaldo automático

El mecanismo de respaldo de OfoxAI cambia automáticamente a un modelo alternativo cuando el modelo principal no está disponible, garantizando la continuidad de su servicio.

Funcionamiento

  1. La solicitud se envía al modelo principal
  2. Si el modelo principal devuelve un error (5xx, timeout, limitación de tasa, etc.)
  3. Se intentan automáticamente los modelos de la lista de fallback en orden
  4. Se devuelve la primera respuesta exitosa

Respaldo por solicitud

Configure el respaldo para una solicitud individual mediante el parámetro provider.fallback:

fallback.py
from openai import OpenAI client = OpenAI( base_url="https://api.ofox.ai/v1", api_key="<su OFOXAI_API_KEY>" ) response = client.chat.completions.create( model="openai/gpt-4o", # Modelo principal messages=[{"role": "user", "content": "Hola"}], extra_body={ "provider": { "fallback": [ "anthropic/claude-sonnet-4.5", # Primera alternativa "google/gemini-3-flash-preview" # Segunda alternativa ] } } ) # Ver el modelo realmente utilizado print(response.model)
fallback.ts
const response = await client.chat.completions.create({ model: 'openai/gpt-4o', messages: [{ role: 'user', content: 'Hola' }], // @ts-ignore Parámetro extendido de OfoxAI provider: { fallback: [ 'anthropic/claude-sonnet-4.5', 'google/gemini-3-flash-preview' ] } })

Configuración de respaldo global

Configure una estrategia de respaldo global en la consola de OfoxAI, sin necesidad de especificarlo en cada solicitud:

  1. Inicie sesión en la consola de OfoxAI 
  2. Vaya a ConfiguraciónEstrategia de enrutamiento
  3. Configure la lista de modelos de respaldo predeterminada

El parámetro fallback a nivel de solicitud individual anula la configuración global.

Condiciones de activación del respaldo

Las siguientes situaciones activan el respaldo:

CondiciónDescripción
HTTP 5xxError del servidor
TimeoutTiempo de respuesta del modelo agotado
429 Limitación de tasaEl modelo upstream alcanzó el límite de tasa
Modelo no disponibleMantenimiento o desconexión del proveedor

Las siguientes situaciones no activan el respaldo:

CondiciónDescripción
HTTP 4xx (excepto 429)Error del cliente que requiere corrección de la solicitud
Filtro de contenidoContenido rechazado por el modelo

Uso combinado con enrutamiento

El mecanismo de respaldo se puede combinar con el enrutamiento de proveedores:

response = client.chat.completions.create( model="openai/gpt-4o", messages=[{"role": "user", "content": "Hola"}], extra_body={ "provider": { "routing": "latency", # Enrutamiento por latencia "fallback": [ # Lista de respaldo "anthropic/claude-sonnet-4.5", "google/gemini-3-flash-preview" ] } } )

Esquemas de respaldo recomendados

Conversación general

"provider": { "fallback": ["anthropic/claude-sonnet-4.5", "google/gemini-3-flash-preview"] }

Generación de código

"provider": { "fallback": ["anthropic/claude-sonnet-4.5", "deepseek/deepseek-chat"] }

Alta relación calidad-precio

"provider": { "fallback": ["openai/gpt-4o-mini", "google/gemini-3-flash-preview", "deepseek/deepseek-chat"] }

Mejores prácticas

  1. Elija modelos alternativos de capacidad similar — Asegure una calidad de salida consistente después del respaldo
  2. Respaldo entre proveedores — Evite que los modelos del mismo proveedor no estén disponibles simultáneamente
  3. Configure 2-3 alternativas — Suficiente para cubrir la mayoría de los escenarios de fallo
  4. Monitoree la frecuencia de respaldo — Si los respaldos son frecuentes, considere cambiar el modelo principal
Last updated on