OfoxAI 支持哪些 API 协议？

OfoxAI 支持三大原生协议：OpenAI 兼容 (https://api.ofox.ai/v1)、Anthropic 原生 (https://api.ofox.ai/anthropic)、Gemini 原生 (https://api.ofox.ai/gemini)。无需修改代码，直接替换 base URL 即可迁移。

OfoxAI 支持哪些 AI 模型？

OfoxAI 支持 100+ 模型，包括 GPT-5.3 Codex、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3.2、Qwen3.5-Plus、Kimi-K2.5、Grok 4、Llama 4 等旗舰和开源模型，以及 Sora、Kling、Flux 等 AIGC 模型。

如何在 Claude Code 中使用 OfoxAI？

只需设置环境变量：export ANTHROPIC_BASE_URL=https://api.ofox.ai/anthropic 和 export ANTHROPIC_AUTH_TOKEN=你的OfoxAI Key，重启 Claude Code 即可。详见 https://docs.ofox.ai/develop/integrations/claude-code

OfoxAI 在中国可以使用吗？

可以。OfoxAI 提供国内直连，通过香港快速节点访问，无需科学上网，低延迟。支持微信/支付宝充值。

장애 복구

OfoxAI의 장애 복구 메커니즘은 주 모델을 사용할 수 없을 때 자동으로 백업 모델로 전환하여 서비스가 중단되지 않도록 합니다.

동작 원리

주 모델로 요청을 전송합니다
주 모델이 오류를 반환하면 (5xx, 타임아웃, 속도 제한 등)
fallback 목록의 모델을 순서대로 자동 시도합니다
첫 번째로 성공한 응답을 반환합니다

단일 요청 장애 복구

provider.fallback 파라미터를 통해 개별 요청에 대한 장애 복구를 설정합니다:

fallback.py


from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="<OFOXAI_API_KEY>"
)
 
response = client.chat.completions.create(
    model="openai/gpt-4o",  # 주 모델
    messages=[{"role": "user", "content": "안녕하세요"}],
    extra_body={
        "provider": {
            "fallback": [
                "anthropic/claude-sonnet-4.5",  # 첫 번째 대체
                "google/gemini-3-flash-preview"              # 두 번째 대체
            ]
        }
    }
)
 
# 실제 사용된 모델 확인
print(response.model)

fallback.ts


const response = await client.chat.completions.create({
  model: 'openai/gpt-4o',
  messages: [{ role: 'user', content: '안녕하세요' }],
  // @ts-ignore OfoxAI 확장 파라미터
  provider: {
    fallback: [
      'anthropic/claude-sonnet-4.5',
      'google/gemini-3-flash-preview'
    ]
  }
})

전역 장애 복구 설정

OfoxAI 콘솔에서 전역 장애 복구 전략을 설정하면, 매 요청마다 지정할 필요가 없습니다:

OfoxAI 콘솔 에 로그인합니다
설정 → 라우팅 전략으로 이동합니다
기본 장애 복구 모델 목록을 설정합니다

개별 요청의 fallback 파라미터는 전역 설정을 덮어씁니다.

장애 복구 트리거 조건

다음 상황에서 장애 복구가 트리거됩니다:

조건	설명
HTTP 5xx	서버 오류
요청 타임아웃	모델 응답 타임아웃
429 속도 제한	업스트림 모델이 속도 제한에 도달
모델 사용 불가	공급자 유지보수 또는 서비스 중단

다음 상황에서는 장애 복구가 트리거되지 않습니다:

조건	설명
HTTP 4xx (429 제외)	클라이언트 오류, 요청 수정 필요
콘텐츠 필터링	모델이 생성을 거부한 콘텐츠

라우팅과 함께 사용

장애 복구 메커니즘은 공급자 라우팅과 결합하여 사용할 수 있습니다:


response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "안녕하세요"}],
    extra_body={
        "provider": {
            "routing": "latency",    # 지연 시간 우선 라우팅
            "fallback": [             # 장애 복구 목록
                "anthropic/claude-sonnet-4.5",
                "google/gemini-3-flash-preview"
            ]
        }
    }
)

모범 사례

능력이 비슷한 대체 모델 선택 — 장애 복구 후에도 출력 품질이 일관되도록 보장
크로스 공급자 장애 복구 — 동일 공급자의 모델이 동시에 사용 불가한 상황 방지
2-3개의 대체 모델 설정 — 대부분의 장애 시나리오에 대응하기에 충분
장애 복구 빈도 모니터링 — 빈번한 장애 복구 발생 시 주 모델 교체를 고려