
发刊词 × 第 1 期|六个值得盯紧的 Agent 运行时项目
「GitHub Agent 框架雷达」发刊。本期扫描 LangGraph、AutoGen 0.4、OpenAI Agents SDK、pydantic-ai、PocketFlow、browser-use 六个项目,附架构亮点与适用场景选型矩阵。

研究速览
这是「GitHub Agent 框架雷达」的第一期。
这个频道只做一件事:每周扫一遍 GitHub 上 agent 运行时与脚手架生态的新动作——新项目、重要版本、Star 暴涨的冷门库——把值得看的摘出来,配上适用场景说明,省去你自己去翻的时间。
本期先放六个当前值得关注的项目,从主流框架到轻量新贵,覆盖不同工程需求。
本期快速索引
| 项目 | Stars | 定位关键词 | 适合谁 |
|---|---|---|---|
| LangGraph | ~10k+ | 有状态图工作流 · 生产就绪 | 需要持久化、可恢复流程的团队 |
| AutoGen 0.4 | 主流 | 事件驱动 · AgentChat API | 多 agent 协作、企业级编排 |
| OpenAI Agents SDK | 27k | 轻量 · 多 agent Handoff | 想快速搭多 agent 流程的开发者 |
| pydantic-ai | 17.7k | FastAPI 体验 · 全类型安全 | Python 工程师,重视类型系统 |
| PocketFlow | ~10k+ | 100 行框架 · 极简 | 快速原型、嵌入现有系统 |
| browser-use | 94k+ | LLM 直接操控浏览器 | 需要网页自动化的 agent 场景 |
六个项目逐一拆解
LangGraph:生产级图工作流,1.2.4 刚发
LangGraph 是目前生产环境中部署最广的 agent 框架之一,基于图(Graph)结构描述 agent 的状态流转,原生支持 PostgreSQL checkpointing 和工作流中断恢复。1
架构亮点:把 agent 逻辑建模为有向图节点,每个节点处理一个逻辑步骤,边是条件跳转。状态(State)显式序列化,支持暂停、恢复、人工介入(Human-in-the-loop)。AWS Bedrock AgentCore 已把它作为默认编排层之一提供托管运行时。2
适用场景:工作流步骤固定、中间状态需要持久化、生产环境要求重试与恢复的 agent 系统。如果你的 agent 需要在某个步骤等待外部审批然后继续,LangGraph 是目前选择最少踩坑的路径。
正在加载内容卡片…
AutoGen 0.4:从零重写,事件驱动架构上线
微软在 2025 年 1 月发布的 AutoGen 0.4 是一次完整重写,而非版本迭代。核心从消息驱动改为事件驱动(event-driven),引入了高层 AgentChat API,同时配套了 AutoGen Studio——一个用于快速原型的低代码界面。3
架构亮点:事件驱动核心意味着 agent 之间不再依赖同步消息链路,每个 agent 可以独立响应事件、并行执行,更贴近分布式系统的设计范式。AgentChat API 把多 agent 协作的配置简化到几行代码,AutoGen Studio 则允许非代码人员在界面上拖拽搭建流程原型。
适用场景:需要多个 agent 分工协作(如:一个负责计划、一个负责执行、一个负责审查)、且希望未来能扩展到分布式部署的团队。
正在加载内容卡片…
OpenAI Agents SDK:27k Stars,最轻量的多 agent 框架
OpenAI 官方发布的 openai-agents-python 目前有 27k Stars,定位是「轻量且强大的多 agent 工作流框架」,支持 OpenAI 全系 API,同时兼容 100+ 其他 LLM。4
核心机制:Handoffs(交接)是这个 SDK 的关键概念——一个 agent 可以把任务移交给另一个专精子 agent,整个过程通过 Session 自动维护对话历史。内置 Guardrails 做输入输出校验,Tracing 工具可以直接看到 agent 执行链路。最新版
v0.17.4 还加了 Realtime Agents,支持基于语音的实时 agent。4适用场景:快速搭建「主 agent + 若干专职子 agent」结构,且愿意跟着 OpenAI 生态走的项目。
pydantic-ai:17.7k Stars,给 Python 工程师的 agent 框架
pydantic-ai 由 Pydantic 团队开发,目标是把 FastAPI 式的开发体验带进 agent 工程。它的核心卖点是全链路类型安全:工具调用的输入输出都经过 Pydantic 验证,错误在开发阶段就被 IDE 捕获,而不是在运行时炸锅。5
架构亮点:
- 模型无关,支持 OpenAI、Anthropic、Gemini、DeepSeek 等,也可接自定义模型
- 原生集成 Pydantic Logfire(基于 OpenTelemetry),直接得到链路追踪和成本监控
- 支持纯 YAML/JSON 定义 agent,无需写 Python 代码
- 兼容 MCP 和 Agent2Agent(A2A)协议,可以和其他框架互操作
当前最新版本
v1.106.0,发布于 2026 年 6 月 4 日,迭代频率很高。5适用场景:Python 工程师为主的团队,重视类型系统和可观测性,不想在 agent 调用链上踩运行时类型错误。
正在加载内容卡片…
PocketFlow:100 行框架,「让 Agent 构建 Agent」
PocketFlow 是这期里面最轻量的选手,整个框架核心只有 100 行代码,定位极简 LLM 工作流工具。目前在 GitHub 上的 Star 数在 8,000–10,000 范围,且持续增长。6
架构思路:不试图解决所有问题,只提供工具调用和任务串联的最小原语,让 agent 本身通过代码生成来构建更复杂的 agent(这也是它「Let Agents build Agents」口号的来源)。结构足够轻量,可以直接嵌入已有系统而不引入重型依赖。
适用场景:需要在现有应用里嵌入轻量 agent 能力、或者想快速验证 agent 工作流设计思路的场景。不适合需要持久化、复杂状态管理的生产级场景。
browser-use:94k Stars,LLM 直接操控浏览器
browser-use 是本期增速最明显的项目,GitHub Stars 已超过 94,000,是 2025–2026 年增速最快的开源 AI 项目之一。7
核心能力:让 LLM 直接接管浏览器——不是给出操作步骤让脚本执行,而是 LLM 自行决策「现在应该点哪里、填什么、跳到哪页」,形成一个完整的浏览器控制 agent 循环。
适用场景:需要 agent 做网页信息采集、表单填写、多步骤网页操作的场景。尤其适合那些没有 API 的网站——只要能用浏览器打开,agent 就能操作。
正在加载内容卡片…
框架选型速查矩阵
上面六个项目覆盖了不同的工程起点,简单归个类:
| 需求 | 推荐优先看 |
|---|---|
| 生产级、需要状态持久化和中断恢复 | LangGraph |
| 多 agent 协作、分布式扩展 | AutoGen 0.4 |
| 快速搭多 agent、OpenAI 生态 | OpenAI Agents SDK |
| Python 工程师、重类型安全 | pydantic-ai |
| 嵌入已有系统、极简依赖 | PocketFlow |
| agent 需要操控浏览器 | browser-use |
下期预告
下期雷达会扫几个工具层的新动作:langgraph-bigtool(解决大工具集上下文爆炸)、MCP-Zero(主动工具发现,覆盖 308 个 MCP 服务器)以及 Google ADK 的近况。如果你用过其中某个,欢迎留言说说实际体验。
围绕这条内容继续补充观点或上下文。