核心概念

Token 计价机制

AI 模型在处理文本时，会将输入和输出文本切分成若干 token（词元）。每次 API 调用的费用 = 消耗的 token 数 × 单价。

平台区分两种 Token 类型，分别计价：

Token 类型	说明	计价方向
Prompt Tokens	输入给模型的文本（用户消息 + 系统提示词）	按 input 单价
Completion Tokens	模型生成的回复文本	按 output 单价

示例：如果某个模型 input 单价为 ¥0.01/1K tokens，output 单价为 ¥0.02/1K tokens，一次调用消耗了 500 个 prompt tokens 和 300 个 completion tokens，则费用为：(500/1000) × 0.01 + (300/1000) × 0.02 = ¥0.011

订阅制说明

使用模型需要先订阅。订阅本质上是一次预充值——你预先为一定数量的 token 付费，然后在使用中逐步消耗。

生命周期

注册 → 充值 → 订阅（扣费）→ 调用 API（消耗 Token）
                  ↓                    ↓
              续充（追加 Token）    余额不足
                  ↓                    ↓
              自动充值（可选）       调用被拒

退订退款

退订时，剩余的 Token 余额按当前模型的 input 单价折算退款，退款金额退还到钱包余额。

注意：退款金额 = 剩余 tokens / 1000 × 当前 input 单价。如果模型已下架，取最后一条定价记录。

余额与冻结

钱包余额为可用余额。当您订阅模型时，订阅金额会从钱包中扣除，转换为对应模型的 Token 余额。Token 余额和钱包余额是分开的：

钱包余额：充值获得，用于订阅和续充模型
Token 余额：从钱包充值到某模型的可用额度，调用时逐步消耗

自动充值

为避免 Token 余额耗尽影响业务，可以自助为已订阅模型配置自动充值：

在「已订阅模型」页面，点击自动充值开关，弹出配置表单
设置触发阈值：当 Token 余额低于此值时触发自动充值
设置充值数量：每次自动充值的 Token 数量
系统会在同步余额数据时检查 Token 余额，低于阈值时自动从钱包扣费续充
钱包余额不足时自动充值失败，记录错误日志

也可在订阅模型时同步配置自动充值参数，一步完成订阅和自动充值设置。

速率限制 (RPM / RPH / RPD)

限制	含义	适用范围
RPM	每分钟最大请求数	单个 API Key
RPH	每小时最大请求数	单个 API Key
RPD	每天最大请求数	单个 API Key

超出限制的 API 调用将返回 429 Too Many Requests，请在客户端实现重试逻辑。

核心概念 ​

Token 计价机制 ​

订阅制说明 ​

生命周期 ​

退订退款 ​

余额与冻结 ​

自动充值 ​

速率限制 (RPM / RPH / RPD) ​