Claude Opus 4.8 没有降价：高价模型如何守住价值？

Claude Opus 4.8 标准 API 价格仍是 $5/M input、$25/M output，fast mode 则是 $10/$50。它不是加入价格战，而是在用可靠性、长任务能力与更少返工守住高价模型的位置。

1. Opus 4.8 没有降价

Anthropic 在 2026-05-28 发布 Claude Opus 4.8。最重要的价格事实其实很直接：官方发布文写明，常规 API 价格沿用 Opus 4.7，也就是 $5/M input tokens、$25/M output tokens。新的 fast mode 会更快，但价格是 $10/M input、$50/M output。

这和 DeepSeek、MiMo 的故事正好相反。中国模型团队在把成本地板往下拉；Anthropic 则是在证明高价路线仍然值得存在：困难、高风险、长时间运行的任务，仍然应该被路由到更可靠的模型。

2. 高价模型卖的是少返工

Opus 4.8 不应该被理解成「更便宜的 tokens」。它更像是「同样标准 token 价格下，更少失败的 agent run」。 Anthropic 强调它有更好的判断、更稳的工具调用、更好的长 context 恢复，以及更愿意标出不确定性。官方还表示，相比 Opus 4.7，Opus 4.8 让自己写出的代码缺陷未经提醒就通过的概率约低四倍。

这很关键，因为高价模型的真实成本不只 API 帐单。如果一个 $25/M output 的模型能让迁移任务少几轮人工 review、少几次 rollback、少一些静默错误，它可能比低 token 单价但需要持续盯着的模型更便宜。

模型	标准 input	标准 output	Fast input	Fast output	Context	输出上限
Claude Opus 4.8	$5/M	$25/M	$10/M	$50/M	1M	128k
Claude Sonnet 4.6	$3/M	$15/M	-	-	1M	64k
Claude Haiku 4.5	$1/M	$5/M	-	-	200k	64k

Claude API 的 models overview 将 Opus 4.8 列为 1M context、同步输出上限 128k、支持 adaptive thinking，API ID 是 claude-opus-4-8。AWS 的 Bedrock model card 也列出它处于 active lifecycle，并标示同样的 1M context 与 128k 输出上限。

3. Fast mode 是速度保险

Fast mode 很容易被误读。它不是更便宜的 Opus 档位，而是更贵的速度通道，目标是最高约 2.5 倍 output tokens per second。你付更高单价，买的是延迟下降，不是 raw token savings。

适合使用 fast mode 的场景，是等待本身很贵的地方：交互式代码 review、分析师 copilot、线上事故处理、面向客户的专家工具，或者一个慢步骤会卡住后续多步的 agent loop。离线批处理通常更适合标准路线或更便宜的模型路由。

4. 什么工作负载值得用

Opus 4.8 最适合失败成本高、任务复杂、判断质量很重要的工作：多 repo 代码迁移、安全审计、法律或财务文档分析、高 context research、browser agent，以及需要跨很多 tool calls 保持状态的长时间异步流程。

Claude Code 的 dynamic workflows 也指向这个方向。Anthropic 描述的是模型先规划大任务，再运行并行 subagents，验证输出后回报结果。这不是便宜聊天模型的用法，而是在押注编排质量比 token 折扣更值钱。

5. 迁移与成本检查清单

明确设置模型 ID 为 claude-opus-4-8，不要假设旧 alias 会自动迁移。
检查 effort：Opus 4.8 默认 high effort，质量可能更好，但 token 使用也要实测。
有意识地使用 adaptive thinking；不要把 pre-4.7 时代的 extended-thinking budgets 原样带过来。
如果 Messages API 请求还设置了非默认 temperature、top_p、top_k，需要移除。
计算完整任务成本：retry、人工 review、cache 行为、tool calls、输出长度，都比标价更重要。

实用的路由规则很简单：错误很贵、监督很少、延迟有商业价值时，用 Opus 4.8；可逆、高量、低风险工作，用更便宜的模型。价格战是真的，但 Opus 4.8 提醒我们，高价模型现在竞争的是可靠性经济学，而不是标价。

本文由 Allen Pan 撰写。如有勘误或想交流，欢迎来信 allen@xyzsleep.com.

1. Opus 4.8 没有降价

2. 高价模型卖的是少返工

3. Fast mode 是速度保险

4. 什么工作负载值得用

5. 迁移与成本检查清单

延伸阅读