Claude Code auto mode：更安全地减少权限确认

本文是中文精读笔记，不是原文全文翻译。

这篇文章解决什么问题

Claude Code 默认会在运行命令或修改文件前请求用户审批，但实际用户会批准绝大多数提示，久而久之形成审批疲劳。auto mode 试图在“每步都问”和“完全跳过权限”之间找到中间态：让分类器自动放行低风险动作，拦截不符合用户意图的危险动作。

auto mode 解决的是一个很现实的问题：权限弹窗太多时，用户会变成机械点击“允许”。这时表面上每个危险动作都经过确认，实际上安全性下降了。Anthropic 的思路不是取消安全，而是把低风险动作自动化，把真正需要人判断的动作留下来。

文章里的双层检查很值得借鉴。输入层 probe 关注外部内容是否包含可疑指令，比如网页、工具输出、README、issue 评论里夹带“忽略上文”。输出层 transcript classifier 则在工具调用前判断当前动作是否符合用户意图。一个防“上下文被污染”，一个防“动作越权”。

特别有意思的是分类器的可见信息设计。它不能盲目读取所有上下文，因为上下文本身可能已经被注入污染；它需要看到足够判断风险的信息，又不能被攻击内容操纵。deny-and-continue 也体现了产品工程思维：拒绝危险动作后，让 Agent 回到安全路径继续做事，而不是直接让任务失败。