Claude Code 最新攻略:Opus 4.8、Dynamic Workflows、Auto Mode 怎么用?

Claude Code 最近更新很密集:Opus 4.8、dynamic workflows、auto mode、agent view、/goal、/usage、/code-review 与 security-guidance plugin 都改变了实战打法。这篇用一套可复制的流程说清楚怎么用。

截至 2026-06-01,Claude Code 已经不只是「开终端让 AI 写代码」。它更像一套 agentic engineering 的小型操作系统:模型选择、effort、背景 sessions、workflows、plugins、review commands、usage 诊断,都会影响实际效果。

这篇把近期官方更新整理成一套可执行打法。主要来源是 Claude Code changelog5 月 25-29 日更新best practices、permission mode 文档,以及 dynamic workflows 官方博客。

1. 先升级,再选对模型

第一步很无聊,但很重要:先升级并确认版本。5 月底这些功能依赖近期 2.1.x 版本,Opus 4.8 支持至少需要 v2.1.154。

claude update
claude --version
claude

认真做 coding task 时,先切到 Opus 4.8。Week 22 更新说明提到,Opus 4.8 已成为多个 Claude 方案与 Anthropic API 的默认模型,默认 high effort,困难任务可以用 /effort xhigh

> /model claude-opus-4-8
> /effort xhigh

/fast 只适合等待时间本身很贵的场景。最新 fast mode 已默认转到 Opus 4.8,价格是 $10/M input$50/M output,约为标准价格 2 倍,换约 2.5 倍速度。它适合 live debugging、互动式 code review,不适合默认为离线批处理打开。

2. 把工作切成三种模式

Claude Code 的任务可以先分三类。小型、可逆修改,普通 session 加测试即可。中型任务要有书面计划、明确验证命令,必要时用 /goal。大型跨 repo 任务,才考虑 background agents 或 dynamic workflows。

工作类型 建议工具 原因
小修复 普通 session + tests 最快,也最容易人工检查。
中型 feature Plan + /goal 让 Claude 持续工作,直到通过可验证条件。
审计、迁移、研究 claude agents 或 workflow 并行调查,避免主 context 被日志和搜索结果塞满。

Anthropic 的 best practices 也强调同一件事:给 Claude 一个可以验证结果的方式,先探索再计划再写代码,并且积极管理 context。实际 prompt 里应该写清楚目标、限制、要看的文件或命令,以及最终验证命令。

3. Dynamic workflows 用在大任务

Dynamic workflows 是近期最大更新。Claude 会为任务写 orchestration script,把工作分发给多个 subagents,检查结果后汇总成一个答案。 Anthropic 把它定位在 codebase-wide audit、大型迁移、大型研究问题,以及需要独立复核的工作。

> create a workflow that audits every payment path for missing idempotency checks
> /workflows

触发方式很明确:当任务大到一个 conversation 协调不住,就在 prompt 里写 workflow。官方公告也提醒,workflows 可能跑数小时到数天, 而且 usage 明显高于普通 Claude Code session,所以第一次要从小范围开始。适合的例子包括:

  • 把所有内部 fetch() 调用迁移到新的 HTTP client
  • 审计所有 route handler 是否缺少 auth check
  • 比较三种重构方案,并让 adversarial agents 尝试击穿每个方案
  • 在大型 repo 里找 dead code,并要求每个候选都先验证再回报

不要把 workflow 用在小修复。它的协调成本和 token 成本本来就高,买的是广度、独立检查和长时间执行能力。

4. Auto mode 与安全边界

Auto mode 会减少 permission prompts,把动作交给 classifier 判断,阻挡破坏性、可疑或超出范围的操作。它适合可信的开发工作, 尤其适合长任务,但仍然是 research preview,不应该取代人工 review、secrets 检查、deploy 审核或 migration 审核。

# Interactive session 里用 Shift+Tab 切换模式。
# Trusted infrastructure 放在 user settings,不放进 repo shared settings。
> /permissions
> /status

Permission docs 写明,auto mode 默认信任 working directory 和 repo remotes;production deploy、force push、大量删除、 外部数据传输等动作默认会被挡下,除非你明确配置。5 月 30 日 changelog 还提到,Bedrock、Vertex、Foundry 上的 Opus 4.7 和 Opus 4.8 可通过 CLAUDE_CODE_ENABLE_AUTO_MODE=1 opt in。若你本机表现不同,以 /status 和最新 changelog 为准。

实用规则:任务开始前,用自然语言写边界。例如「不要 push、不要 deploy、不要改 billing code,测试通过就停」。真正的组织硬规则, 应该写进 managed settings 的 deny rules,而不是只依赖对话上下文。

5. 用 plugins、review、usage 控成本

新打法不是「让 agent 跑更久」这么简单。越长的 run 越需要护栏。只要 Claude 会改重要代码,就建议安装官方 security-guidance plugin。它会检查代码修改中的漏洞,并在 commit 或 push 周期做更深的 review。

> /plugin install security-guidance@claude-plugins-official
> /reload-plugins

然后配合 review commands。想找 correctness bugs,用 /code-review high;想清理重复、简化结构、提升可读性, 用 /simplify。最近更新后,这两个命令的角色已经分开,不要混用。

> /code-review high
> /simplify
> /usage

/usage 很重要,因为 Claude Code 成本已经不只是一段 chat。费用可能来自 subagents、skills、plugins、MCP servers、 cache misses、long context、fast mode 和 workflows。长任务结束后先看 usage,再决定要不要把这个流程变成团队默认。

6. 一套可复制的实战流程

如果是实际 repo,我会这样跑:

  1. 升级 Claude Code,进入 repo,跑 /status
  2. 切到 claude-opus-4-8;只有困难规划或高风险修改才用 /effort xhigh
  3. 先让 Claude 探索,并列出它看到的文件、命令和风险。
  4. 要求它写计划,并指定唯一验证命令,例如 npm testpytest 或 build。
  5. 中型任务设置 /goal tests pass and build is clean
  6. 大型任务要求 workflow,但确认 scope 后再让它 fan out。
  7. 最后跑 /code-review high,再跑 /simplify,然后自己检查 diff。
  8. 收尾看 /usage,判断这套成本是否值得常态化。

核心心态很简单:Claude Code 最适合被当成一个初级工程团队来管理,而不是 autocomplete。给它上下文、隔离环境、 可衡量的完成条件和 review gate。最近更新让这套模式更强,但也让成本与安全边界更重要。