使用量トラッキング
OfoxAI コンソールは包括的な使用量統計とパフォーマンスモニタリング機能を提供しています。
リアルタイム使用量統計
概要パネル
コンソールのトップページには主要な指標が表示されます:
- 総リクエスト数 — 当期間内の API 呼び出し総数
- 総 Token 数 — 消費された prompt + completion トークンの総数
- 総料金 — 当期間内の累計料金
- 成功率 — API リクエストの成功率
時間トレンド
さまざまな時間軸でトレンドを確認できます:
| 時間軸 | 説明 |
|---|---|
| リアルタイム | 直近1時間、分単位の粒度 |
| 日 | 直近24時間、時間単位の粒度 |
| 週 | 直近7日間、日単位の粒度 |
| 月 | 直近30日間、日単位の粒度 |
多次元分析
モデル別分析
各モデルの使用状況を確認できます:
- リクエスト数の割合
- Token 消費の割合
- 料金の割合
- 平均レイテンシ
プロバイダー別分析
各プロバイダーノードのパフォーマンスを確認できます:
- 成功率の比較
- レイテンシ分布
- フォールバックトリガー頻度
API Key別分析
各 API Key の使用状況を確認できます:
- 各 Key のリクエスト量
- 各 Key の料金
- プロジェクト/チームごとのコスト追跡に便利
異常アラート
アラートルール
以下のアラートを設定できます:
| アラートタイプ | 説明 |
|---|---|
| エラー率アラート | エラー率がしきい値を超えた場合(例:5%) |
| 料金アラート | 日/週/月の料金が予算を超過した場合 |
| レイテンシアラート | 平均レイテンシがしきい値を超えた場合 |
| フォールバックアラート | フォールバックトリガー頻度が異常な場合 |
通知チャネル
アラートは以下の通知方式に対応しています:
- メール通知
- Webhook(Slack、Lark、DingTalk などに連携可能)
アラート設定はコンソールの 設定 → アラートルール で管理できます。
ベストプラクティス
- 異なるプロジェクトには異なる API Key を使用 — プロジェクトごとのコスト追跡に便利です
- 料金アラートを設定 — 予想外の高額請求を防止します
- 定期的にモデル分布を確認 — モデル選択が期待通りか確認します
- エラー率のトレンドに注目 — 異常な上昇は設定の問題を示している可能性があります
Last updated on