Skip to Content
API 레퍼런스API 개요

API 개요

OfoxAI는 세 가지 프로토콜을 통한 API 접속 방식을 제공하며, 각 제공사의 공식 SDK와 완벽하게 호환됩니다.

Base URL

프로토콜Base URL설명
OpenAI 호환https://api.ofox.ai/v1OpenAI SDK 호환, 모든 모델 지원
Anthropic 네이티브https://api.ofox.ai/anthropicAnthropic SDK 호환, 네이티브 Claude 경험
Gemini 네이티브https://api.ofox.ai/geminiGoogle GenAI SDK 호환

인증

모든 프로토콜은 동일한 OfoxAI API Key를 사용하지만, Header 형식은 프로토콜에 따라 다릅니다:

프로토콜Header형식
OpenAIAuthorizationBearer sk-xxx
Anthropicx-api-keysk-xxx
Geminix-goog-api-keysk-xxx

자세한 내용은 인증 가이드를 참조하세요.

사용 가능한 엔드포인트

OpenAI 호환 프로토콜

엔드포인트메서드설명
/v1/chat/completionsPOST대화 완성 생성
/v1/embeddingsPOST텍스트 임베딩 생성
/v1/modelsGET사용 가능한 모델 목록
/v1/models/{model_id}GET모델 상세 정보 조회
/v1/images/generationsPOST이미지 생성

Anthropic 네이티브 프로토콜

엔드포인트메서드설명
/anthropic/v1/messagesPOSTMessages 생성

Gemini 네이티브 프로토콜

엔드포인트메서드설명
/gemini/v1beta/models/{model}:generateContentPOST콘텐츠 생성
/gemini/v1beta/models/{model}:streamGenerateContentPOST스트리밍 콘텐츠 생성

속도 제한

OfoxAI는 종량제로 운영되며, 모든 사용자에게 동일한 속도 제한 정책이 적용됩니다:

제한 항목할당량
RPM (요청/분)200
TPM (토큰/분)무제한

더 높은 속도 할당량이 필요한 경우, OfoxAI 지원 에 문의하여 조정을 요청하세요.

속도 제한에 도달하면 API는 429 Too Many Requests를 반환하며, 응답 Header에 다음이 포함됩니다:

x-ratelimit-limit-requests: 200 x-ratelimit-remaining-requests: 0 x-ratelimit-reset-requests: 1s

에러 코드

모든 프로토콜은 통일된 HTTP 상태 코드를 반환합니다:

상태 코드설명일반적인 원인
200성공
400잘못된 요청파라미터 형식 오류, 필수 필드 누락
401인증 실패API Key가 유효하지 않거나 만료됨
403권한 부족해당 모델에 대한 접근 권한 없음
404리소스 없음모델 ID 오류
429속도 제한속도 제한 초과
500서버 오류내부 오류, 재시도 필요
502업스트림 오류모델 공급자 서비스 이상
503서비스 불가서비스 점검 중

에러 응답 형식

{ "error": { "code": "invalid_api_key", "message": "제공된 API Key가 유효하지 않습니다. 확인 후 다시 시도해 주세요.", "type": "authentication_error" } }

OfoxAI 확장 파라미터

OfoxAI는 표준 프로토콜에 더하여 고급 라우팅 및 장애 복구를 위한 확장 파라미터를 제공합니다:

{ "model": "openai/gpt-4o", "messages": [...], "provider": { "routing": "cost", "fallback": ["anthropic/claude-sonnet-4.5", "google/gemini-3-flash-preview"] } }

자세한 내용은 공급자 라우팅장애 복구를 참조하세요.

Last updated on