用量追蹤
OfoxAI 控制台提供全方位的用量統計和性能監控。
即時用量統計
總覽面板
控制台首頁展示關鍵指標:
- 總請求數 — 當前週期內的 API 呼叫總數
- 總 Token 數 — 消耗的 prompt + completion token 總數
- 總費用 — 當前周期內的累計費用
- 成功率 — API 請求成功率
時間趨勢
支援按不同時間維度查看趨勢:
| 維度 | 說明 |
|---|---|
| 即時 | 最近 1 小時,按分鐘粒度 |
| 日 | 最近 24 小時,按小時粒度 |
| 周 | 最近 7 天,按天粒度 |
| 月 | 最近 30 天,按天粒度 |
多維度分析
按模型分析
查看各模型的使用情況:
- 請求次數佔比
- Token 消耗佔比
- 費用佔比
- 平均延遲
按供應商分析
查看各供應商節點的表現:
- 成功率對比
- 延遲分佈
- 回退觸發頻率
按 API Key 分析
查看各 API Key 的使用情況:
- 各 Key 的請求量
- 各 Key 的費用
- 便於按專案/團隊追蹤成本
異常告警
告警規則
可設定以下告警:
| 告警類型 | 說明 |
|---|---|
| 錯誤率告警 | 錯誤率超過閾值(如 5%) |
| 費用告警 | 日/周/月費用超過預算 |
| 延遲告警 | 平均延遲超過閾值 |
| 回退告警 | 回退觸發頻率異常 |
通知管道
告警支援以下通知方式:
- 郵件通知
- Webhook(可整合到 Slack、飛書、釘釘等)
告警設定在控制台 設定 → 告警規則 中管理。
最佳實踐
- 為不同專案使用不同 API Key — 便於按專案追蹤成本
- 設定費用告警 — 避免意外的高額帳單
- 定期檢查模型分佈 — 確保模型選擇符合預期
- 關注錯誤率趨勢 — 異常上升可能表示設定問題
Last updated on