Claude Opus 4.8 没有降价:高价模型如何守住价值?

Claude Opus 4.8 标准 API 价格仍是 $5/M input、$25/M output,fast mode 则是 $10/$50。它不是加入价格战,而是在用可靠性、长任务能力与更少返工守住高价模型的位置。

1. Opus 4.8 没有降价

Anthropic 在 2026-05-28 发布 Claude Opus 4.8。最重要的价格事实其实很直接: 官方发布文写明,常规 API 价格沿用 Opus 4.7, 也就是 $5/M input tokens$25/M output tokens。新的 fast mode 会更快,但价格是 $10/M input$50/M output

这和 DeepSeek、MiMo 的故事正好相反。中国模型团队在把成本地板往下拉;Anthropic 则是在证明高价路线仍然值得存在: 困难、高风险、长时间运行的任务,仍然应该被路由到更可靠的模型。

2. 高价模型卖的是少返工

Opus 4.8 不应该被理解成「更便宜的 tokens」。它更像是「同样标准 token 价格下,更少失败的 agent run」。 Anthropic 强调它有更好的判断、更稳的工具调用、更好的长 context 恢复,以及更愿意标出不确定性。官方还表示, 相比 Opus 4.7,Opus 4.8 让自己写出的代码缺陷未经提醒就通过的概率约低四倍。

这很关键,因为高价模型的真实成本不只 API 帐单。如果一个 $25/M output 的模型能让迁移任务少几轮人工 review、 少几次 rollback、少一些静默错误,它可能比低 token 单价但需要持续盯着的模型更便宜。

模型 标准 input 标准 output Fast input Fast output Context 输出上限
Claude Opus 4.8$5/M$25/M$10/M$50/M1M128k
Claude Sonnet 4.6$3/M$15/M--1M64k
Claude Haiku 4.5$1/M$5/M--200k64k

Claude API 的 models overview 将 Opus 4.8 列为 1M context、同步输出上限 128k、支持 adaptive thinking,API ID 是 claude-opus-4-8。AWS 的 Bedrock model card 也列出它处于 active lifecycle,并标示同样的 1M context 与 128k 输出上限。

3. Fast mode 是速度保险

Fast mode 很容易被误读。它不是更便宜的 Opus 档位,而是更贵的速度通道,目标是最高约 2.5 倍 output tokens per second。 你付更高单价,买的是延迟下降,不是 raw token savings。

适合使用 fast mode 的场景,是等待本身很贵的地方:交互式代码 review、分析师 copilot、线上事故处理、面向客户的专家工具, 或者一个慢步骤会卡住后续多步的 agent loop。离线批处理通常更适合标准路线或更便宜的模型路由。

4. 什么工作负载值得用

Opus 4.8 最适合失败成本高、任务复杂、判断质量很重要的工作:多 repo 代码迁移、安全审计、法律或财务文档分析、 高 context research、browser agent,以及需要跨很多 tool calls 保持状态的长时间异步流程。

Claude Code 的 dynamic workflows 也指向这个方向。Anthropic 描述的是模型先规划大任务,再运行并行 subagents, 验证输出后回报结果。这不是便宜聊天模型的用法,而是在押注编排质量比 token 折扣更值钱。

5. 迁移与成本检查清单

  1. 明确设置模型 ID 为 claude-opus-4-8,不要假设旧 alias 会自动迁移。
  2. 检查 effort:Opus 4.8 默认 high effort,质量可能更好,但 token 使用也要实测。
  3. 有意识地使用 adaptive thinking;不要把 pre-4.7 时代的 extended-thinking budgets 原样带过来。
  4. 如果 Messages API 请求还设置了非默认 temperaturetop_ptop_k,需要移除。
  5. 计算完整任务成本:retry、人工 review、cache 行为、tool calls、输出长度,都比标价更重要。

实用的路由规则很简单:错误很贵、监督很少、延迟有商业价值时,用 Opus 4.8;可逆、高量、低风险工作,用更便宜的模型。 价格战是真的,但 Opus 4.8 提醒我们,高价模型现在竞争的是可靠性经济学,而不是标价。