核心概念
Token 计价机制
AI 模型在处理文本时,会将输入和输出文本切分成若干 token(词元)。每次 API 调用的费用 = 消耗的 token 数 × 单价。
平台区分两种 Token 类型,分别计价:
| Token 类型 | 说明 | 计价方向 |
|---|---|---|
| Prompt Tokens | 输入给模型的文本(用户消息 + 系统提示词) | 按 input 单价 |
| Completion Tokens | 模型生成的回复文本 | 按 output 单价 |
示例:如果某个模型 input 单价为 ¥0.01/1K tokens,output 单价为 ¥0.02/1K tokens,一次调用消耗了 500 个 prompt tokens 和 300 个 completion tokens,则费用为:(500/1000) × 0.01 + (300/1000) × 0.02 = ¥0.011
订阅制说明
使用模型需要先订阅。订阅本质上是一次预充值——你预先为一定数量的 token 付费,然后在使用中逐步消耗。
生命周期
注册 → 充值 → 订阅(扣费)→ 调用 API(消耗 Token)
↓ ↓
续充(追加 Token) 余额不足
↓ ↓
自动充值(可选) 调用被拒退订退款
退订时,剩余的 Token 余额按当前模型的 input 单价折算退款,退款金额退还到钱包余额。
注意:退款金额 = 剩余 tokens / 1000 × 当前 input 单价。如果模型已下架,取最后一条定价记录。
余额与冻结
钱包余额为可用余额。当您订阅模型时,订阅金额会从钱包中扣除,转换为对应模型的 Token 余额。Token 余额和钱包余额是分开的:
- 钱包余额:充值获得,用于订阅和续充模型
- Token 余额:从钱包充值到某模型的可用额度,调用时逐步消耗
自动充值
为避免 Token 余额耗尽影响业务,可以自助为已订阅模型配置自动充值:
- 在「已订阅模型」页面,点击自动充值开关,弹出配置表单
- 设置触发阈值:当 Token 余额低于此值时触发自动充值
- 设置充值数量:每次自动充值的 Token 数量
- 系统会在同步余额数据时检查 Token 余额,低于阈值时自动从钱包扣费续充
- 钱包余额不足时自动充值失败,记录错误日志
也可在订阅模型时同步配置自动充值参数,一步完成订阅和自动充值设置。
速率限制 (RPM / RPH / RPD)
| 限制 | 含义 | 适用范围 |
|---|---|---|
| RPM | 每分钟最大请求数 | 单个 API Key |
| RPH | 每小时最大请求数 | 单个 API Key |
| RPD | 每天最大请求数 | 单个 API Key |
超出限制的 API 调用将返回 429 Too Many Requests,请在客户端实现重试逻辑。
