您的位置：首页 > > 教程攻略 > ai资讯 >80%代码由Claude合并，Anthropic内部人员点破Agent真相：「Close the Loop」

80%代码由Claude合并，Anthropic内部人员点破Agent真相：「Close the Loop」

来源:互联网 更新时间:2026-06-25 13:48

最近，Anthropic团队研究产品经理Theodora（Theo）Chu的一段演讲视频，在圈子里引起了不少讨论。 Theo提到，现在越来越多的开发者已经不光是“听说过Claude”，而是实实在在感受到了日常效率的提升。有人说效率翻倍，也有人觉得提升了10倍。更关键的是，Claude已经开始深度嵌入Anthropic内部的工程流程——**Anthropic内部超过80%的代码由Claude合并。** ![img](http://img.318050.com/uploads/20260625/17823579396a3c9fb35ffaa208494964.webp) 这意味着，模型的角色正在发生变化。它不再只是停留在“回答问题”的阶段，而是进入了一个可以反馈、验证、修正的持续任务环境。**核心思路是：Close the Loop（闭合循环），给模型一种验证自身输出结果的方式。** 这场分享的核心，其实是想告诉开发者：**你应该如何适应这个新世界，又应该如何面向未来构建产品，而不是只为过去构建产品。** 为此，Theo详细拆解了如何构建能够自我改进的Agent——**真正的配置，是让Claude在循环、计划模式和动态工作流中持续运行。** 网友rari@0xwhrrari的评价是，“这要比大多数300美元的Agent课程都要好。” 那么，接下来，我们就来详细梳理一下这场演讲的核心内容。 ## 一年之内，模型失败率被大幅压低 Theo用编程评估基准SWE-bench Verified举了个例子。它由一系列GitHub issue组成，模型需要理解问题、修改代码，并通过测试来证明自己真正解决了任务——这是Anthropic内部用来观察Claude编程能力提升的重要评测：一年前的Sonnet 3.7得分仅为60%左右，而到了Opus 4.8，得分已经达到了88%。 ![img](http://img.318050.com/uploads/20260625/17823579396a3c9fb397a83786107807.webp) 这意味着，**一年前的模型在这些任务上的失败次数，大约是现在的3倍。** 这也是演讲中最值得注意的要点：**模型能力提升，并不只是“多做对几道题”，而是失败率正在快速下降。** 失败率下降之后，模型才有可能承担更长、更复杂、更接近真实工作的任务。更不可思议的是，在最新的Mythos和Fable系列模型中，该基准测试实际上已经出现接近饱和的迹象。换句话说，一些过去足够难的测试，今天可能已经不再能有效区分模型能力。这对开发者来说是一个重要信号：**如果你还在用12个月前的任务测试今天的模型，就很容易低估模型真正的能力边界。** 而新模型这种智能的增长，具体落在了以下三个核心领域： ### 一是先规划，再行动 Theo展示了同一个任务在两个不同模型上的表现：让模型一次性重建Claude.ai网站。结果表明，旧模型的典型做法是，上来就开始写大量代码、调用大量工具，几乎没有充分规划。结果是，界面看起来似乎合理，但实际运行并不完整，功能也不能真正闭环。 “有点像我装宜家家具时的样子：一上来就动手，根本不看说明书，先开始拼，拼着拼着发现做错了，然后才意识到自己应该回去看说明书。” 而以Opus 4.8为代表的新模型则表现出了自适应思考（Adaptive thinking）的能力。它们会先在内部深思熟虑具体的规范，在预先规划的过程中及时捕捉错误（你甚至会在逻辑推理中看到它们输出“实际上……”或“算了，还是……”这样的自我修正词）。这种先规划后行动的方式，让模型在第一次实际执行时就能高效落地，大幅减少了不必要的工具调用与代码行数。因此，Theo给开发者的建议是：**要允许模型先思考。** ![img](http://img.318050.com/uploads/20260625/17823579406a3c9fb4bda3d691885247.webp) 产品体验也应该为这种思考留下空间：比如使用自适应思考，让模型自己判断什么时候需要思考、需要思考多久。简单问题不必让模型大动干戈，但复杂任务应该给它足够的规划空间。 ### 二是错误恢复和自我纠正过去很多人做Agent，重点放在“让模型能调用更多工具”。但Theo强调：**工具调用本身还不够，模型必须知道自己什么时候做错了。** 旧模型有一个常见问题是doom looping：模型接到任务之后，如果失败了，你告诉它：“嘿，我觉得你应该换一种方式做”。或者，环境给了它某种反馈，提示它应该做另一件事。它会说：“好的，我再试一次。” 但当它再次尝试时，往往又会回到之前同样的解法，并不会真正改变做法。新模型在这方面进步明显。它能够读取反馈、理解失败原因，然后尝试不同路径。这样一来，模型不再只是被动执行命令，而是开始具备某种错误恢复能力。这对Agent产品尤其关键。因为只要任务足够长，模型就一定会遇到错误：代码跑不通、页面点击失败、测试没有通过、用户反馈不满意、环境返回异常结果。真正有价值的Agent，不是永远不犯错，而是犯错之后能不能恢复。因此，Theo认为，**开发者需要重新设计模型所处的环境。环境要能给模型反馈，让模型知道自己哪里做错了。** ![img](http://img.318050.com/uploads/20260625/17823579406a3c9fb4eade8089869162.webp) “这也意味着，模型不会因为doom looping而浪费token，而是可以用更少的token完成任务。” 比如，如果你正在做一个应用生成Agent，就应该给它访问前端界面的能力，让它可以自己点击、自己测试、自己判断按钮是否可用、页面是否正常。模型只有拿到这些验证信号，才有可能形成：执行 → 验证 → 修正 → 再执行。而这一点，也正是前面网友rari@0xwhrrari认为很重要的一点：**close the agent loop（闭环智能体循环）**，“Loop设计，让模型能够验证自身的输出结果。” ### 三是模型越来越擅长在更长任务周期上运行旧模型在长任务中经常会陷入“跟丢主线”（Losing the plots）的窘境，用户给它一个长任务，它做着做着就忘了最初目标，或在执行到一半时遗忘最初的上下文或核心指令。而现在，模型在长程任务的上下文连贯性上有了显著突破，能够稳定地将注意力维持在100万个Token甚至更高的级别。这意味着开发者不再需要把上下文窗口切得那么碎，而是可以直接将整个代码库递给模型。 ![img](http://img.318050.com/uploads/20260625/17823579416a3c9fb5210d9794734612.webp) 未来更合理的方式，**是把更完整的任务交给模型。** 比如，给它整个代码库，而不是只给它某个文件；给它完整产品需求，而不是只给一个孤立函数；让它跑完整流程，而不是只完成一个局部步骤。当规划能力、错误恢复能力和长上下文能力叠加到一起，Agent的形态就会发生变化。它可以先规划，再执行；执行之后，通过工具或人类反馈验证结果；如果发现问题，就调整计划，继续执行。这个循环持续进行，直到最终完成任务。 ## 开发者该如何为未来进行构建？随着模型变得越来越智能，用户基本上可以让它运行更长时间，而它完成任务的效率和效果都会比过去更好。那么，从战术上讲，用户现在到底应该如何为这个“未来”构建产品？也就是说，如何为正在变得越来越强的模型构建产品？ Theo认为，开发者在产品与工程层面需要全面升级自己的研发战术： **一是主动保持野心，动态刷新评估基准（Evals）** 首先，要更大胆地尝试、允许Claude处理更多事情，不要总是测试那些你觉得Claude 12个月前就能完成的任务，而应该开始思考那些Claude今天还做不到的任务，并持续关注这些任务。另外，在模型快速进步之后，开发者最容易遇到的一个误判是：觉得新模型没有明显提升。其实，**背后原因可能不在模型，而在Evals。** Theo提到，有些客户在新模型发布后会说：“我的Evals只提升了1%，所以这个模型好像没强多少。”但真正用起来之后，他们又会发现，新模型在某些能力上提升非常明显，只是原来的Evals根本没有测到。这说明，**Evals也会过时。** AI时代，Evals有点像单元测试，它可以帮助开发者判断模型是否真正具备某种能力，也可以帮助产品团队追踪模型变化对用户体验的影响。但一个好的Eval，不能只测试今天模型已经会做的事情，还应该包含今天模型尚未完全解决、但未来用户体验真正需要的任务。换句话说，**Evals要面向未来设计。** 不要只盯着眼前的客户体验，要将用户报告的最新失败模式，以及你希望应用未来发展的方向融入到测试用例中。如果某些遗留问题被证明不可解，请立刻更新更难的题目。 **二是精简“脚手架”（Shrink the Scaffolding）** Theo反复强调的另一个建议是：**shrink your scaffolding，缩小模型周围的“脚手架”。** 所谓“脚手架”，即在工程实践中，开发者为了修补旧模型的各种漏洞，在其周围套上的系统提示词、外部工具、代码Harness，以及各种围绕模型搭建的约束和补丁。比如，模型某次引用格式错了，就加一条规则；模型某次没遵守要求，就再写一段约束；模型某次调用工具失败，就在外层加更多逻辑……这些补丁在旧模型时代可能有用。但当新模型的指令遵循能力变强之后，旧补丁反而可能成为问题。 Theo举了Anthropic自身的一个例子。团队曾一度以为新模型在Claude.ai的引用功能上出了Bug，后来检查才发现，是因为新模型遵循指令的能力大幅提升，导致它极其听话地去执行了一行很久以前写在系统提示词里、但现在已经过时的引用格式指令。团队最终只需将那行过时的提示词彻底删掉，功能便恢复了正常。这说明，开发者应当“针对意图”去编写简洁的提示词，明确最终想要的结果，而不是围绕着过去老模型的失败经验去过度包装。给模型松绑，精简“脚手架”，让它拥有更多的自主权，你才能看清它真正的天花板在哪里。 **三是闭环设计，让模型验证自身的输出结果** **模型要完成更复杂的任务，只会思考还不够，它还需要动作能力。** 这是构建自改进Agent最核心的底层逻辑。既然模型已经具备了极强的错误恢复能力，就必须在工程上**“闭环智能体循环”**（Close the Agent Loop）： **给模型留出思考与工作的空间：** 引入自适应思考机制。在产品设计上允许模型进行前端思考，甚至可以通过投入度拨盘（Effort Dial）让模型可以自由上调或下调在某个复杂问题上的钻研程度。 **以受控的方式开放高权限：** 想要发挥Agent的自主性，就必须赋予它在环境里采取行动的权限。Anthropic在Claude Code中推出了“自动模式”分类器，它能够在“开发者的控制欲”与“模型的自主权”之间找到完美平衡，自动甄别哪些行动是安全可取的，防止模型误删环境。 **提供自我质检的工具：** 应该为Agent配备诸如“Computer Use”这样的自动化验证工具，让智能体能够自己去前端到处点一点、做质检，通过环境的真实反馈发现自身的错误，从而实现代码的自我迭代与修正。参考链接： https://x.com/0xwhrrari/status/2069163624375976103

80%代码由Claude合并，Anthropic内部人员点破Agent真相：「Close the Loop」

热门资讯

热门手游

相关攻略

热门专题