1. Token 是什么
输入 token
你发给模型的内容都会算输入:需求描述、代码文件、报错日志、历史对话、工具说明、系统提示词等。
输出 token
模型生成的内容算输出:解释、计划、代码、补丁、命令说明、测试结论。输出通常比输入更贵。
缓存 token
长对话里重复出现的项目上下文可能被缓存。缓存读取通常比普通输入便宜,但首次写入缓存也可能收费。
AI 编程为什么特别费 token
Claude Code、Codex、OpenClaw 这类 Agent 不只是聊天。它会读文件、列目录、执行命令、接收命令输出、再把这些结果喂回模型。一次“修复 bug”可能包含多轮工具调用,所以 token 消耗会明显高于普通问答。
2. Token 价格怎么看
主流 API 通常按每 100 万 token 计价,英文写作 MTok 或 1M tokens。
基础计算公式
费用 =
输入 token / 1,000,000 × 输入单价
+ 输出 token / 1,000,000 × 输出单价
+ 缓存写入 / 1,000,000 × 缓存写入单价
+ 缓存读取 / 1,000,000 × 缓存读取单价
+ 工具调用附加费用
一个简单例子
如果某模型输入 ¥2 / 百万 token,输出 ¥8 / 百万 token,一次任务消耗 100k 输入和 20k 输出:
100,000 / 1,000,000 × 2 = ¥0.20
20,000 / 1,000,000 × 8 = ¥0.16
本次约 ¥0.36
真实 Agent 任务还会叠加缓存、工具、图片、搜索、代码执行等成本。
常见官方 API 价格示例
| 平台 / 模型 | 输入 | 缓存读取 | 输出 | 备注 |
|---|---|---|---|---|
| Claude Sonnet 4.6 | $3 / MTok | $0.30 / MTok | $15 / MTok | Anthropic 官方 API,缓存写入另计。 |
| Claude Opus 4.8 | $5 / MTok | $0.50 / MTok | $25 / MTok | 高能力模型,输出成本更高。 |
| OpenAI gpt-5.3-codex | $1.75 / MTok | $0.175 / MTok | $14 / MTok | OpenAI API pricing 中的 Codex 类模型。 |
| MiniMax-M2.7 | ¥2.1 / 百万 token | ¥0.42 / 百万 token | ¥8.4 / 百万 token | MiniMax 官方按量计费。 |
| Kimi K2.6 API | $0.95 / MTok 缓存未命中 | $0.16 / MTok | $4 / MTok | Kimi 官方 API 价格页示例。 |
这些价格是 2026-06-04 查询到的公开页面示例,不是长期承诺。
3. 什么是 Coding Plan
一句话解释
Coding Plan 是面向 AI 编程工具的包月或包年套餐。你购买后拿到专属 API Key 和 Base URL,把它配置到 Claude Code、Cursor、Cline、OpenClaw、OpenCode、Codex CLI 等工具里使用。
它和普通 API 的区别
普通 API 是按 token 后付或预付扣费;Coding Plan 通常是固定月费 + 额度限制。额度可能按 token、请求数、prompt 次数、5 小时窗口、每周窗口或积分来计算。
| 对比项 | 普通 API 按量 | Coding Plan / Token Plan |
|---|---|---|
| 费用 | 按 token、工具调用或资源用量扣费。 | 固定订阅费,额度耗尽后等周期恢复或升级。 |
| 适用场景 | 产品后端、自动化脚本、企业集成、批量任务。 | 个人或团队在编程工具里的交互式编码。 |
| 风险 | 用量失控可能产生高额账单。 | 通常不会继续扣余额,但可能限流、排队或额度耗尽。 |
| 限制 | 限制较少,但成本按量增长。 | 常见限制是不得用于 SaaS 后端、批量 API、共享转售或非指定工具。 |
4. 国内常见 Code Plan 介绍
下面按公开文档整理常见方案,不做购买推荐。不同活动、地区、账号状态、是否新客会影响价格和额度。
| 方案 | 公开信息摘要 | 适合谁 | 注意点 |
|---|---|---|---|
| MiniMax Token Plan | 标准版 ¥29 / ¥49 / ¥119 每月;极速版 ¥98 / ¥199 / ¥899 每月。文本模型 M2.7 / M2.7-highspeed,按 5 小时请求窗口给额度。 | 想用 MiniMax 模型做高频代码任务,且希望套餐价格清晰的人。 | 标准版和极速版速度、额度不同;高峰期可能有动态限流。 |
| 智谱 GLM Coding Plan | 面向 AI 编码订阅,支持 GLM-5.1、GLM-5-Turbo、GLM-4.7、GLM-4.5-Air。Lite / Pro / Max 分别约 80 / 400 / 1600 prompts 每 5 小时,另有周额度。 | 需要 GLM 模型、中文需求理解、MCP 扩展和多编码工具兼容的人。 | 高阶模型会按倍率消耗额度;必须使用指定 Coding API 端点和支持工具。 |
| 阿里云百炼 Coding Plan | 官方文档显示 Pro 高级套餐 ¥200 / 月,整合 qwen、Kimi、GLM、MiniMax 等模型,每 5 小时约 6,000 次请求。 | 希望在一个套餐中切换多家模型,且已经使用阿里云生态的人。 | 专属 API Key / Base URL 与百炼普通按量 API 不互通;文档明确禁止非交互式批量调用。 |
| 腾讯云 Token Plan / Coding Plan | 覆盖混元、GLM、Kimi、MiniMax 等国产模型,兼容 Claude Code、OpenCode、Cline、Cursor、Codex CLI 等工具。活动页显示个人档位如 39、99 元起。 | 想一份额度池接多个工具、同时试多种国产模型的人。 | 同一套餐额度共享;文档强调仅限 AI 工具使用,禁止用于自动化脚本和产品后端。 |
| 火山方舟 Coding Plan / Agent Plan | Coding Plan 支持 Doubao、DeepSeek、GLM、MiniMax、Kimi 等模型,兼容 Claude Code、Cursor、Cline、OpenCode、OpenClaw、Hermes Agent 等工具。Agent Plan 更偏多模态和 Harness 能力。 | 想在豆包 / DeepSeek / GLM / Kimi / MiniMax 之间自由切换,或需要 Agent / 多模态扩展的人。 | 活动页价格可能动态加载;Coding Plan 和 Agent Plan 资源池、定位不同,购买前要确认用的是哪一个。 |
| Kimi Code / Kimi 会员权益 | Kimi Code 是 Kimi 会员中的开发者权益,支持 Kimi Code CLI、Claude Code、Roo Code 等工具;额度按会员统一额度池和 7 天刷新周期管理。 | 偏好 Kimi 模型,主要做个人开发,并希望用会员权益覆盖编码任务的人。 | 官方说明 Kimi Code 面向个人开发,不适合企业开发场景;月度总额度和 5 小时频率窗口都可能触发限制。 |
5. 怎么选
轻度使用
优先选低价档或按量 API。目标是试工具、熟悉配置、偶尔修 bug,不要一开始就买高档包年。
日常开发
选有 5 小时窗口、周额度和用量看板的方案。重点看是否支持你常用的工具:Claude Code、Cursor、OpenClaw、OpenCode 等。
重度 Agent
关注并发、限流、缓存效率、模型切换和失败重试。Agent 会自动读写文件和跑命令,额度消耗比聊天快得多。
购买前检查清单
- 确认套餐支持你要用的工具和协议:Anthropic 兼容、OpenAI 兼容,或二者都支持。
- 确认 Base URL 是 Coding Plan 专属地址,不要和普通 API 地址混用。
- 确认额度单位:token、request、prompt、credit 不是一回事。
- 确认额度刷新周期:5 小时、7 天、每月、积分有效期。
- 确认是否允许企业场景、自动化脚本、多人共享、批量调用。
- 确认续费价,不只看首月特惠价。
6. 注意事项
不要只看“几元起”
首月特惠、邀请折扣、连续包月折扣很常见。真正要看的是续费价、额度、限流策略和你实际工作流的消耗速度。
不要把个人套餐当 API 后端
很多 Coding Plan 明确限制只能在指定编程工具中使用,不允许接到 SaaS 后端、批量脚本、自动化服务或转售共享。
警惕第三方中转
价格极低的非官方中转可能存在模型替换、Key 风险、隐私风险、稳定性风险。公司代码、客户数据、密钥和日志不应随意交给不可信服务。
用 CC Switch 管理配置
如果你经常切换多个供应商,可以用 CC Switch 保存不同 Base URL、API Key 和模型配置,避免手动改 JSON / TOML / env 文件。
参考来源
整理日期:2026-06-04。价格、额度、模型名单变化频繁,以下来源只用于本页编写时的信息核对。