OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

Routage de fournisseurs

OfoxAI supporte une architecture multi-fournisseurs où le même modèle peut être servi par différents n\u0153uds de fournisseurs. Grâce aux stratégies de routage, vous pouvez contrôler la distribution des requêtes.

Stratégies de routage

Stratégie	Description	Cas d’utilisation
`priority`	Par ordre de priorité (par défaut)	Priorité à la stabilité
`cost`	Priorité au coût le plus bas	Traitement par lots, sensible au coût
`latency`	Priorité à la latence la plus faible	Conversation en temps réel, interaction utilisateur
`balanced`	Équilibrage de charge	Scénarios à haute concurrence

Mode d’utilisation

Configurez la stratégie de routage via le paramètre étendu provider.routing :

routing.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<votre OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Bonjour"}],
    extra_body={
        "provider": {
            "routing": "cost"  # Priorité au coût le plus bas
        }
    }
)

routing.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: 'Bonjour' }],
  // @ts-ignore Paramètre étendu OfoxAI
  provider: {
    routing: 'cost'
  }
})

Détail des stratégies

`priority` — Routage par priorité (par défaut)

Distribue les requêtes selon l’ordre de priorité prédéfini par OfoxAI. Utilise en priorité les nœuds les plus stables.

`cost` — Priorité au coût

Sélectionne automatiquement le nœud du fournisseur avec le coût le plus bas. Idéal pour le traitement par lots, l’étiquetage de données et autres scénarios où la latence n’est pas critique.

`latency` — Priorité à la latence

Sélectionne le nœud du fournisseur avec la latence de réponse la plus faible. Idéal pour les scénarios de conversation en temps réel nécessitant des réponses rapides.

`balanced` — Équilibrage de charge

Distribue les requêtes de manière uniforme entre tous les nœuds de fournisseurs disponibles. Idéal pour les scénarios à haute concurrence, évitant la surcharge d’un point unique.

Bonnes pratiques

Conversation en temps réel — utilisez latency pour un temps d’attente utilisateur réduit
Tâches par lots — utilisez cost pour réduire le coût global
Environnement de production — utilisez priority par défaut pour garantir la stabilité
Combinez avec le repli — Les stratégies de routage peuvent être combinées avec le paramètre fallback

Vous pouvez également configurer une stratégie de routage globale par défaut dans la console OfoxAI, sans avoir à la spécifier dans chaque requête.