监控看板

用户趋势

日活跃用户（DAU）与新增用户。

活跃用户构成（按日）

新用户活跃与老用户活跃。

用户留存率（%）

新增用户 cohort 留存热力图。

使用强度（人均）

判断次数、对话次数和人均 token。

收入与 AI 成本

已收款、已核销收入、AI token 成本、毛利趋势和成本占比。

购买点数套餐分布（按收入）

各套餐贡献收入占比。

关键转化指标

付费、ARPU、ARPPU、购买次数与收入核销。

SLO 与错误预算

可用性、错误预算消耗、P95/P99 延迟和 15 分钟错误窗口。

风险优先级

合并模型、路由、失败和服务器资源风险。

AI 吞吐与限额

QPM / QPS / TPM 峰值和模型限额占用。

当前压力

近 60 秒和 15 分钟窗口。

稳定性趋势

随时间范围切换分钟、小时或天级请求量、峰值 QPM、错误和 AI 成本。

失败统计

失败类型、上游 HTTP 和慢请求线索。

路由健康

按功能接口查看错误率和 P95。

服务器资源

CPU/内存长期趋势、网络 IO、磁盘 IO、事件循环和数据库池。

调用看板

近 7 天健康度、payload 覆盖和规范调用类型

只看完整 payload

时间	类型	状态	用户	Prompt	耗时

用户运营台

运营关注用户状态、成本和关键路径。

用户	自律豆	今日用量	Token / 成本	在线心跳	设备	最近活跃

订单

查看订单、收入统计、支付链路和自律豆发放异常。

时间 / 订单	用户	渠道	自律豆商品 / 金额	状态	链路	设备	更新时间

Playground

手动配置或从 trace / prompt 带入

Source Request ID Prompt Key Prompt Version ID Provider Model

Messages

支持多轮消息、图片、排序和复制；运行前会用变量值编译

模型参数

常用参数显式配置，新字段放高级 JSON

Max Tokens Temperature Top P Seed Presence Penalty Frequency Penalty

Response Format Thinking

Stop，一行一个

Tools JSON

高级参数 JSON

请求预览

变量替换后的真实请求体

结果

等待运行

当前草稿

对比变体

评测集

把真实 trace 固化为可复跑样本；点击进入独立详情页。

未选择

	ID	名称	类型	数据量	标准答案	已评测	通过率	来源	更新时间	操作

评测集详情

未选择评测集

Case	标准答案	图片	来源日志	操作

实验

批量复跑评测集；点击进入独立详情页查看结果和 trace。

实验	评测集	Prompt	分数 / 结果	进度	操作

实验详情

未选择实验

只看问题 case 本次跑多少条

等待运行。

Case	预期	Actual Output	结果	来源

人工标注任务

把实验输出转成预标注队列，人工逐条复核并保存最终标签。

任务	来源实验	进度	状态	更新时间

Prompt Registry

Prompt key 是线上代码引用的稳定入口；版本创建不会自动影响生产。

智能识别库

加载中

启用	App	包名 / 前缀	来源	排名	操作

游戏榜每天固定从公开应用市场拉取并合并；已有禁用规则不会被重新启用。信息流列表可在这里人工补充或禁用。

Cloud API Reference

OpenAPI 3.1 + Scalar 渲染，包含路径、参数、schema、鉴权和示例。

新窗口打开

AI Ops

监控看板

用户趋势

活跃用户构成（按日）

用户留存率（%）

使用强度（人均）

收入与 AI 成本

购买点数套餐分布（按收入）

关键转化指标

SLO 与错误预算

风险优先级

AI 吞吐与限额

当前压力

稳定性趋势

失败统计

路由健康

服务器资源

调用看板

用户运营台

订单

Playground

Messages

对比变体

请求预览

结果

当前草稿

对比变体

评测集

评测集详情

实验

实验详情

人工标注任务

标注任务

Prompt Registry

选择 Prompt Key

模型供应商

Prompt 路由配置

自律豆商品

客服入口

智能识别库

App 更新策略

当前可选版本

修改密码

Cloud API Reference

选择最低可用版本

提交新版本

生成评测集

新建实验

从实验创建人工标注任务

上传 CSV 新建/覆盖评测集

Case 详情

新建用户

编辑账号属性

调整自律豆

编辑商品