Tag
Long Running Agents
这里聚合所有与 Long Running Agents 相关的文章与指南。
Agent Harness 2026/3/25
长时任务 Agent 真正缺的不是智力,而是交接、恢复与验收能力
长时任务 agent 的失败,往往并不源于模型不会思考,而源于系统没有把'交接、恢复、验证、续跑'设计成一等公民。本文基于 Anthropic 对 long-running agent harness 的讨论,延展出我对跨会话执行、状态外化、feature contract、smoke test、browser verification 和多轮执行结构的完整看法,也解释了为什么真正可用的 agent,不是一次跑很久,而是一轮一轮接得住。
Agents Long Running Agents Harness Anthropic Verification