平台简介
什么是科华词元平台
科华词元平台是一个基于 OpenResty + PHP 的高性能 AI 代理管理平台,为企业提供统一的 AI 模型接入和管理服务。平台位于 AI 服务提供商与终端用户之间,充当智能代理层,提供路由、鉴权、计量、管控等核心能力。
核心价值
| 价值 | 说明 |
|---|---|
| 统一接入 | 一个入口接入多个 AI 模型供应商,无需为每个服务商分别对接 |
| 成本可控 | 订阅制 Token 计费,支持自动充值阈值,避免超额消费 |
| 安全可靠 | API Key 鉴权、速率限制、多节点负载均衡,保障服务稳定性 |
| 透明可审计 | 完整的调用日志和用量统计,每一笔消耗都可追溯 |
核心概念
Token(词元)
Token 是平台的基本计费单位。AI 模型在处理文本时,会将文本切分成若干 token(词元)。每次 API 调用消耗的 token 数取决于输入和输出的文本长度。
平台区分 输入(Prompt)Token 和 输出(Completion)Token,分别计价。定价以「每 1K tokens」为单位,在模型市场中清晰展示。
订阅制
使用模型需要先订阅。订阅时需支付一定数量的 Token 费用,此后调用模型时从 Token 余额中扣除。余额不足时调用会被拒绝,续充后可继续使用。
- 订阅:首次订阅,按选择的 Token 数量扣费
- 续充:为已订阅模型追加 Token 余额
- 退订:取消订阅,剩余 Token 按当前 input 单价折算退款
API Key
API Key 是调用 AI 接口的凭证,格式为 sk- 开头的字符串。每个用户可以创建多个 Key,分别管理。Key 可以随时启用或禁用,禁用后使用该 Key 的请求将被拒绝。
速率限制 (Rate Limit)
平台支持三种粒度的速率限制:
| 限制 | 全称 | 说明 |
|---|---|---|
| RPM | Requests Per Minute | 每分钟最多请求次数 |
| RPH | Requests Per Hour | 每小时最多请求次数 |
| RPD | Requests Per Day | 每天最多请求次数 |
超出限制的请求将返回 429 Too Many Requests。
平台架构概览
用户客户端 ──→ OpenResty 代理层 ──→ AI 模型供应商
│
↓
PHP 管理面 ──→ MySQL 数据库- OpenResty:数据面,处理所有 API 请求,负责鉴权、速率限制、请求转发
- PHP-FPM:管理面,提供管理后台 API,处理用户、模型、订阅等管理操作
- MySQL:持久化存储用户、模型、订阅、用量等数据
