用量追踪
OfoxAI 控制台提供全方位的用量统计和性能监控。
实时用量统计
总览面板
控制台首页展示关键指标:
- 总请求数 — 当前周期内的 API 调用总数
- 总 Token 数 — 消耗的 prompt + completion token 总数
- 总费用 — 当前周期内的累计费用
- 成功率 — API 请求成功率
时间趋势
支持按不同时间维度查看趋势:
| 维度 | 说明 |
|---|---|
| 实时 | 最近 1 小时,按分钟粒度 |
| 日 | 最近 24 小时,按小时粒度 |
| 周 | 最近 7 天,按天粒度 |
| 月 | 最近 30 天,按天粒度 |
多维度分析
按模型分析
查看各模型的使用情况:
- 请求次数占比
- Token 消耗占比
- 费用占比
- 平均延迟
按供应商分析
查看各供应商节点的表现:
- 成功率对比
- 延迟分布
- 回退触发频率
按 API Key 分析
查看各 API Key 的使用情况:
- 各 Key 的请求量
- 各 Key 的费用
- 便于按项目/团队追踪成本
异常告警
告警规则
可配置以下告警:
| 告警类型 | 说明 |
|---|---|
| 错误率告警 | 错误率超过阈值(如 5%) |
| 费用告警 | 日/周/月费用超过预算 |
| 延迟告警 | 平均延迟超过阈值 |
| 回退告警 | 回退触发频率异常 |
通知渠道
告警支持以下通知方式:
- 邮件通知
- Webhook(可集成到 Slack、飞书、钉钉等)
告警配置在控制台 设置 → 告警规则 中管理。
最佳实践
- 为不同项目使用不同 API Key — 便于按项目追踪成本
- 设置费用告警 — 避免意外的高额账单
- 定期检查模型分布 — 确保模型选择符合预期
- 关注错误率趋势 — 异常上升可能表示配置问题