Skip to Content

用量追蹤

OfoxAI 控制台提供全方位的用量統計和性能監控。

即時用量統計

總覽面板

控制台首頁展示關鍵指標:

  • 總請求數 — 當前週期內的 API 呼叫總數
  • 總 Token 數 — 消耗的 prompt + completion token 總數
  • 總費用 — 當前周期內的累計費用
  • 成功率 — API 請求成功率

時間趨勢

支援按不同時間維度查看趨勢:

維度說明
即時最近 1 小時,按分鐘粒度
最近 24 小時,按小時粒度
最近 7 天,按天粒度
最近 30 天,按天粒度

多維度分析

按模型分析

查看各模型的使用情況:

  • 請求次數佔比
  • Token 消耗佔比
  • 費用佔比
  • 平均延遲

按供應商分析

查看各供應商節點的表現:

  • 成功率對比
  • 延遲分佈
  • 回退觸發頻率

按 API Key 分析

查看各 API Key 的使用情況:

  • 各 Key 的請求量
  • 各 Key 的費用
  • 便於按專案/團隊追蹤成本

異常告警

告警規則

可設定以下告警:

告警類型說明
錯誤率告警錯誤率超過閾值(如 5%)
費用告警日/周/月費用超過預算
延遲告警平均延遲超過閾值
回退告警回退觸發頻率異常

通知管道

告警支援以下通知方式:

  • 郵件通知
  • Webhook(可整合到 Slack、飛書、釘釘等)

告警設定在控制台 設定告警規則 中管理。

最佳實踐

  1. 為不同專案使用不同 API Key — 便於按專案追蹤成本
  2. 設定費用告警 — 避免意外的高額帳單
  3. 定期檢查模型分佈 — 確保模型選擇符合預期
  4. 關注錯誤率趨勢 — 異常上升可能表示設定問題
Last updated on