自主 Agent / 上下文工程资料索引
自主 Agent / 上下文工程资料索引和个人的一些点评,基本以工程为主。学术界普遍集中在 Agent RL 上,这里不进行展开。
- Building effective agents by Anthropic
- 【可选】24年12月的文章,比较鲜明的将 Workflow 和 Autonomous Agent 拆分,并着重在未来 Agent 的发展。
- How we built our multi-agent research system by Anthropic
- 【必读】Anthropic 的博客文章,核心解析 Claude Deep Research 的技术框架,介绍了 SubAgent(Agent as Tool)、Todo tools 等方法。
- Effective context engineering for AI agents by Anthropic
- 【必读】Anthropic 上下文工程标志性文章,包括上下文压缩、SubAgent、Agentic Memory 等方法的介绍。
- Introducing advanced tool use on the Claude Developer Platform by Anthropic
- 【必读】介绍Tool Search Tool(工具搜索工具)、Programmatic Tool Calling(程序化工具调用)、Tool Use Examples(工具示例)三种范式,虽然实现细节被隐藏到 Claude API 之后,但不难复刻。
- 相关文章:
- Code execution with MCP: Building more efficient agents Programmatic Tool Calling 范式的首次介绍。
- Equipping agents for the real world with Agent Skills by Anthropic
- 【必读】介绍 Agent Skills 范式,Skills 目前是最优雅的 Agent 垂直能力注入方式,强烈建议采用。
- Beyond permission prompts: making Claude Code more secure and autonomous Anthropic
- 【可选】Claude Code Sandbox 机制的介绍,同时有开源实现 sandbox-runtime 供参考,是比较轻量级的 Sandbox 实现。还可以通过 Container 来进行较重的实现。
- Writing effective tools for agents — with agents by Anthropic
- 【必读】如何为 Agent 设计更有效的工具,不是把接口封装到 MCP Server 那么简单,参数、返回值、描述和错误信息都需要优化。
- Claude Code: Best practices for agentic coding by Anthropic
- 【可选】跨时代的产品: Claude Code 的发布文章。
- 相关资料
- Claude Code Changelog:追踪 Claude Code 的系统提示词的变化,能学到很多 Agent 设计技巧。
- Building agents with the Claude Agent SDK by Anthropic
- 【必读】使用 Claude Agent SDK 开发自主 Agent,虽然效果依然最佳,但 Agent SDK 的底层是闭源的 Claude Code,谨慎使用。
- Effective harnesses for long-running agents by Anthropic
- 【必读】讲设计长时运行 Agent 的一些经验,内容不多但有较大价值。
- Context Engineering for Agents by Lance Martion and Langchain
- 【必读】上下文工程的另一个介绍,图主要来自于 Langchain 的 blog。
- Context Engineering in Manus by Manus
- Measuring AI Ability to Complete Long Tasks by METR
- 【可选】我经常引用的评测结果:自主Agent 能够完成的等效人类任务时长每7个月翻一番。
- Kimi CLI Agent by Kimi
- 【必读】设计良好,代码非常优雅的 CLI Agent 开源项目。
- DeepAgents by Langchain
- 【必读】LangChain 的自主 Agent 实现,借鉴了 LangGraph 的成功经验,提出的 Middleware 机制对上下文工程来说是非常不错的抽象。更新很快,Skills等均已经得到支持。还提供一个不错的 UI 界面。
- Agents 2.0: From Shallow Loops to Deep Agents by Philschmid
- 【可选】提出了 Agent 2.0 的概念,算是个总结。
- Learning the Bitter Lesson by Lance Martin
- 【可选】把 Bitter Lesson 和目前的 Agent 结合,也是我最近引用的一种思想。
- rLLM SDK: Training Any Agentic Program without Code Changes by rLLM
- 【可选】有很多 Agent RL Training 的库,尝试了一圈,还是 rLLM 更可靠,更新更快。ART、agent-lightning 等项目都有各自的问题。
- The Hitchhikers Guide to LLM Agent by Saurabhalone
- 【必读】作者从头搭建了一个 Coding Agent,这是他的经验,最近比较好的文章之一。
- Skills vs Dynamic MCP Loadouts by Armin Ronachers
- 【可选】很简单的一件事,使用 Skills 替代 MCP, 这也是我的实践。
- Beyond Pipelines: A Survey of the Paradigm Shift toward Model-Native Agentic AI
- 【可选】一篇综述文章,介绍从Pipeline(Workflow)到自主 Agent 的范式转移。