跳转至

用量统计

用量统计模块是大模型服务平台的基本功能之一,旨在帮助用户全面掌握大模型调用过程中的资源消耗情况。 该模块整合了多维度数据,如调用总量、输入输出 token 数等,支持用户进行成本分析、资源优化和业务决策。

usage

其核心价值为:

  • 成本管控:精确统计调用量(以千 tokens 为单位),结合平台计费规则,帮助用户预估和控制成本,避免资源浪费。
  • 业务分析:通过趋势图和模型分布,深入了解不同业务场景下的调用特征,优化模型选择与业务流程。
  • 资源优化:识别高频、高消耗模型,合理配置资源,提升平台整体效率。

操作说明

登录大模型服务平台后,在左侧导航栏点击 用量统计,即可进入模块主界面,开始数据查询与分析。

设置筛选条件

  • API Key 筛选:点击 “API Key” 下拉菜单,可选择某个特定 Key 或 “全部” 查看对应的用量数据。
  • 模型筛选:通过 “调用模型” 下拉菜单,选择特定模型(如 public/deepseek-r1)或 “全部”,聚焦目标模型的数据分析。
  • 时间范围筛选:点击时间选择框(默认“近两周”),可自定义时间段(如单日、多日),满足不同统计需求。

查看与解读数据

  • 用量概览:页面顶部展示三项核心指标:

    • 调用总量(千 tokens)
    • 输入总量(千 tokens)
    • 输出总量(千 tokens) 快速掌握整体资源使用情况。
  • 趋势图分析:下方折线图展示不同模型在所选时间段内的用量走势。图例区分模型,例如 public/deepseek-r1 显示为紫色线。 可切换 “总量”、“输入”、“输出” 三个维度,辅助分析调用趋势和业务波动。

数据刷新

点击页面右上角的刷新图标,即可获取最新用量数据,确保展示内容实时、准确。

应用场景示例

  • 成本核算

    财务人员可在月末选择 “全部 API Key” 并设定当月时间范围,查看调用总量等数据,并结合 token 单价,计算出大模型使用成本,生成费用报表。

  • 业务诊断与优化

    当某业务线响应变慢时,分析师可通过该模块筛选相关 API Key 和模型,查看用量趋势。若发现调用量激增且模型性能下降,可及时调整模型或优化调用策略。

  • 运维与资源规划

    运维人员可定期(如每周)查看各模型的调用量及变化趋势,识别资源瓶颈:

  • 对高频模型,提前扩容保障服务能力;

  • 对低频模型,考虑缩减资源以提高整体利用率。