Respaldo automático
El mecanismo de respaldo de OfoxAI cambia automáticamente a un modelo alternativo cuando el modelo principal no está disponible, garantizando la continuidad de su servicio.
Funcionamiento
- La solicitud se envía al modelo principal
- Si el modelo principal devuelve un error (5xx, timeout, limitación de tasa, etc.)
- Se intentan automáticamente los modelos de la lista de fallback en orden
- Se devuelve la primera respuesta exitosa
Respaldo por solicitud
Configure el respaldo para una solicitud individual mediante el parámetro provider.fallback:
fallback.py
from openai import OpenAI
client = OpenAI(
base_url="https://api.ofox.ai/v1",
api_key="<su OFOXAI_API_KEY>"
)
response = client.chat.completions.create(
model="openai/gpt-4o", # Modelo principal
messages=[{"role": "user", "content": "Hola"}],
extra_body={
"provider": {
"fallback": [
"anthropic/claude-sonnet-4.5", # Primera alternativa
"google/gemini-3-flash-preview" # Segunda alternativa
]
}
}
)
# Ver el modelo realmente utilizado
print(response.model)fallback.ts
const response = await client.chat.completions.create({
model: 'openai/gpt-4o',
messages: [{ role: 'user', content: 'Hola' }],
// @ts-ignore Parámetro extendido de OfoxAI
provider: {
fallback: [
'anthropic/claude-sonnet-4.5',
'google/gemini-3-flash-preview'
]
}
})Configuración de respaldo global
Configure una estrategia de respaldo global en la consola de OfoxAI, sin necesidad de especificarlo en cada solicitud:
- Inicie sesión en la consola de OfoxAI
- Vaya a Configuración → Estrategia de enrutamiento
- Configure la lista de modelos de respaldo predeterminada
El parámetro fallback a nivel de solicitud individual anula la configuración global.
Condiciones de activación del respaldo
Las siguientes situaciones activan el respaldo:
| Condición | Descripción |
|---|---|
| HTTP 5xx | Error del servidor |
| Timeout | Tiempo de respuesta del modelo agotado |
| 429 Limitación de tasa | El modelo upstream alcanzó el límite de tasa |
| Modelo no disponible | Mantenimiento o desconexión del proveedor |
Las siguientes situaciones no activan el respaldo:
| Condición | Descripción |
|---|---|
| HTTP 4xx (excepto 429) | Error del cliente que requiere corrección de la solicitud |
| Filtro de contenido | Contenido rechazado por el modelo |
Uso combinado con enrutamiento
El mecanismo de respaldo se puede combinar con el enrutamiento de proveedores:
response = client.chat.completions.create(
model="openai/gpt-4o",
messages=[{"role": "user", "content": "Hola"}],
extra_body={
"provider": {
"routing": "latency", # Enrutamiento por latencia
"fallback": [ # Lista de respaldo
"anthropic/claude-sonnet-4.5",
"google/gemini-3-flash-preview"
]
}
}
)Esquemas de respaldo recomendados
Conversación general
"provider": {
"fallback": ["anthropic/claude-sonnet-4.5", "google/gemini-3-flash-preview"]
}Generación de código
"provider": {
"fallback": ["anthropic/claude-sonnet-4.5", "deepseek/deepseek-chat"]
}Alta relación calidad-precio
"provider": {
"fallback": ["openai/gpt-4o-mini", "google/gemini-3-flash-preview", "deepseek/deepseek-chat"]
}Mejores prácticas
- Elija modelos alternativos de capacidad similar — Asegure una calidad de salida consistente después del respaldo
- Respaldo entre proveedores — Evite que los modelos del mismo proveedor no estén disponibles simultáneamente
- Configure 2-3 alternativas — Suficiente para cubrir la mayoría de los escenarios de fallo
- Monitoree la frecuencia de respaldo — Si los respaldos son frecuentes, considere cambiar el modelo principal
Last updated on