Skip to Content

用量追踪

OfoxAI 控制台提供全方位的用量统计和性能监控。

实时用量统计

总览面板

控制台首页展示关键指标:

  • 总请求数 — 当前周期内的 API 调用总数
  • 总 Token 数 — 消耗的 prompt + completion token 总数
  • 总费用 — 当前周期内的累计费用
  • 成功率 — API 请求成功率

时间趋势

支持按不同时间维度查看趋势:

维度说明
实时最近 1 小时,按分钟粒度
最近 24 小时,按小时粒度
最近 7 天,按天粒度
最近 30 天,按天粒度

多维度分析

按模型分析

查看各模型的使用情况:

  • 请求次数占比
  • Token 消耗占比
  • 费用占比
  • 平均延迟

按供应商分析

查看各供应商节点的表现:

  • 成功率对比
  • 延迟分布
  • 回退触发频率

按 API Key 分析

查看各 API Key 的使用情况:

  • 各 Key 的请求量
  • 各 Key 的费用
  • 便于按项目/团队追踪成本

异常告警

告警规则

可配置以下告警:

告警类型说明
错误率告警错误率超过阈值(如 5%)
费用告警日/周/月费用超过预算
延迟告警平均延迟超过阈值
回退告警回退触发频率异常

通知渠道

告警支持以下通知方式:

  • 邮件通知
  • Webhook(可集成到 Slack、飞书、钉钉等)

告警配置在控制台 设置告警规则 中管理。

最佳实践

  1. 为不同项目使用不同 API Key — 便于按项目追踪成本
  2. 设置费用告警 — 避免意外的高额账单
  3. 定期检查模型分布 — 确保模型选择符合预期
  4. 关注错误率趋势 — 异常上升可能表示配置问题