Claude Opus 4.8 没有降价:高价模型如何守住价值?
Claude Opus 4.8 标准 API 价格仍是 $5/M input、$25/M output,fast mode 则是 $10/$50。它不是加入价格战,而是在用可靠性、长任务能力与更少返工守住高价模型的位置。
1. Opus 4.8 没有降价
Anthropic 在 2026-05-28 发布 Claude Opus 4.8。最重要的价格事实其实很直接: 官方发布文写明,常规 API 价格沿用 Opus 4.7, 也就是 $5/M input tokens、$25/M output tokens。新的 fast mode 会更快,但价格是 $10/M input、$50/M output。
这和 DeepSeek、MiMo 的故事正好相反。中国模型团队在把成本地板往下拉;Anthropic 则是在证明高价路线仍然值得存在: 困难、高风险、长时间运行的任务,仍然应该被路由到更可靠的模型。
2. 高价模型卖的是少返工
Opus 4.8 不应该被理解成「更便宜的 tokens」。它更像是「同样标准 token 价格下,更少失败的 agent run」。 Anthropic 强调它有更好的判断、更稳的工具调用、更好的长 context 恢复,以及更愿意标出不确定性。官方还表示, 相比 Opus 4.7,Opus 4.8 让自己写出的代码缺陷未经提醒就通过的概率约低四倍。
这很关键,因为高价模型的真实成本不只 API 帐单。如果一个 $25/M output 的模型能让迁移任务少几轮人工 review、 少几次 rollback、少一些静默错误,它可能比低 token 单价但需要持续盯着的模型更便宜。
| 模型 | 标准 input | 标准 output | Fast input | Fast output | Context | 输出上限 |
|---|---|---|---|---|---|---|
| Claude Opus 4.8 | $5/M | $25/M | $10/M | $50/M | 1M | 128k |
| Claude Sonnet 4.6 | $3/M | $15/M | - | - | 1M | 64k |
| Claude Haiku 4.5 | $1/M | $5/M | - | - | 200k | 64k |
Claude API 的 models overview
将 Opus 4.8 列为 1M context、同步输出上限 128k、支持 adaptive thinking,API ID 是
claude-opus-4-8。AWS 的 Bedrock model card
也列出它处于 active lifecycle,并标示同样的 1M context 与 128k 输出上限。
3. Fast mode 是速度保险
Fast mode 很容易被误读。它不是更便宜的 Opus 档位,而是更贵的速度通道,目标是最高约 2.5 倍 output tokens per second。 你付更高单价,买的是延迟下降,不是 raw token savings。
适合使用 fast mode 的场景,是等待本身很贵的地方:交互式代码 review、分析师 copilot、线上事故处理、面向客户的专家工具, 或者一个慢步骤会卡住后续多步的 agent loop。离线批处理通常更适合标准路线或更便宜的模型路由。
4. 什么工作负载值得用
Opus 4.8 最适合失败成本高、任务复杂、判断质量很重要的工作:多 repo 代码迁移、安全审计、法律或财务文档分析、 高 context research、browser agent,以及需要跨很多 tool calls 保持状态的长时间异步流程。
Claude Code 的 dynamic workflows 也指向这个方向。Anthropic 描述的是模型先规划大任务,再运行并行 subagents, 验证输出后回报结果。这不是便宜聊天模型的用法,而是在押注编排质量比 token 折扣更值钱。
5. 迁移与成本检查清单
- 明确设置模型 ID 为
claude-opus-4-8,不要假设旧 alias 会自动迁移。 - 检查
effort:Opus 4.8 默认 high effort,质量可能更好,但 token 使用也要实测。 - 有意识地使用 adaptive thinking;不要把 pre-4.7 时代的 extended-thinking budgets 原样带过来。
- 如果 Messages API 请求还设置了非默认
temperature、top_p、top_k,需要移除。 - 计算完整任务成本:retry、人工 review、cache 行为、tool calls、输出长度,都比标价更重要。
实用的路由规则很简单:错误很贵、监督很少、延迟有商业价值时,用 Opus 4.8;可逆、高量、低风险工作,用更便宜的模型。 价格战是真的,但 Opus 4.8 提醒我们,高价模型现在竞争的是可靠性经济学,而不是标价。