AI Agent 30天速成｜Day4 教学笔记

强健的石头

13人浏览 · 2026-06-28 17:12:02

强健的石头 · 2026-06-28 17:12:02 发布

今日总学习目标

理解Agent规划、任务拆解核心思想，掌握ReAct、Plan-Solve标准推理框架
基于前3天代码，实现自主任务拆解Agent（复杂问题自动拆分多子任务）
实现多工具串行/并行调度、任务状态管理、失败子任务重试机制
整合RAG知识库+Function Calling+任务规划，完成全能基础智能体
每日时长分配（全天8h）

理论笔记阅读+理解：2.5h
代码编写调试：4h
复盘+面试背诵：1.5h

一、核心理论教学笔记

1. Agent规划核心概念

1.1 什么是任务规划

当用户提出复合型复杂问题（多步骤、多工具、多知识库查询），大模型无法一次性给出答案，需要先拆解成多个可执行子任务，按顺序分步执行，最后汇总结果。
例：“帮我计算(125+36)*8，同时查询RAG定义，最后汇总成一段总结”
拆解子任务：

调用计算器计算125+36
调用计算器计算结果×8
RAG检索RAG相关知识
整合全部结果输出总结

1.2 两大主流推理框架（面试必考）

（1）ReAct 推理+行动框架（最简单、入门首选）

核心逻辑：Thought→Action→Observation循环

Thought：模型思考当前需要做什么、下一步执行什么工具/检索
Action：输出标准化工具调用/检索指令
Observation：拿到工具/知识库返回结果，作为观察输入下一轮思考
循环往复直到任务全部完成，输出最终答案。
优势：实现简单、天然适配Function Calling；缺点：复杂多步骤任务容易跳步、漏任务。

（2）Plan-Solve 先规划后执行框架

两步流程：

Plan阶段：模型一次性输出完整任务清单（结构化JSON子任务列表），包含任务类型、执行顺序、依赖关系
Solve阶段：程序按顺序逐个执行子任务，缓存每个子任务结果，全部完成后统一汇总
优势：任务清晰可控，便于监控、断点续跑、失败重试；缺点：一次性规划消耗更多Token，复杂依赖场景规划易出错。

1.3 子任务类型分类（统一抽象）

统一封装三类任务，一套调度器兼容所有任务：

calc：数学计算工具调用（复用Day2计算器）
rag_search：知识库检索任务（复用Day3 RAG）
llm_summary：纯文本推理总结任务（无需外部工具）

1.4 任务依赖规则

无依赖任务：可并行执行（多个独立RAG查询）
强依赖任务：必须等待前置子任务完成才能执行（先求和再相乘）

2. 任务调度与状态管理

2.1 任务状态枚举

pending：待执行
running：执行中
success：执行成功
failed：执行失败（支持重试）
finished：全部完成

2.2 核心调度能力

任务缓存：存储每个子任务ID、类型、入参、执行结果、状态
重试机制：单个子任务失败最多重试2次，仍失败标记任务异常
执行顺序控制：区分串行依赖、并行独立任务
终止条件：所有子任务success，或达到最大规划轮次强制汇总

3. 规划Agent上下文与Token优化

规划阶段仅传入用户原始问题，不携带冗余历史，减少规划开销
每个子任务执行结果精简压缩，避免大量文本累积超限
设置最大规划轮次（默认5轮），防止无限循环拆解任务

4. 完整全能Agent链路（Day1~Day4全能力整合）

用户复杂提问
→ Plan：模型拆解结构化子任务列表
→ 调度器循环执行每个子任务
- 子任务=计算：调用Function Calling计算器
- 子任务=知识库查询：执行RAG检索
- 子任务=文本推理：直接LLM生成
→ 缓存所有子任务执行结果
→ LLM汇总全部子任务输出，生成最终完整回答

二、今日学习重点

掌握ReAct与Plan-Solve两种Agent推理框架区别与适用场景
定义标准化子任务JSON Schema，强制模型输出任务清单
实现通用任务调度器，支持任务状态、重试、串行执行
整合LLM、RAG、Function Calling、任务规划一体化Agent
处理规划异常：任务格式错乱、子任务重复、依赖顺序错误

三、今日难点 & 解决方案

难点1：模型拆解任务格式混乱，无法解析子任务列表

解决方案：

使用Pydantic定义任务列表Schema，Prompt强制输出纯JSON
temperature设为0，消除随机性
正则提取JSON、解析失败自动重新规划一次
Few-shot给出标准任务拆解示例

难点2：子任务执行失败导致整体流程中断

解决方案：

单个任务捕获全部异常，标记failed，记录错误信息继续执行剩余任务
配置单任务最大重试次数，重试失败后在最终汇总中提示异常
汇总阶段告知用户哪些任务执行失败，给出失败原因

难点3：模型无限拆解、产生大量冗余子任务

解决方案：

全局限制最大规划轮次，到达上限停止拆解直接汇总已有结果
Prompt约束：无需拆分的简单问题直接回答，禁止多余子任务
任务去重：调度器过滤重复类型、重复入参的子任务

难点4：多子任务结果过长，Token超限

解决方案：

每个子任务执行后自动精简输出文本，剔除换行、冗余描述
汇总前做滑动窗口裁剪，只保留关键任务结果
长结果分段摘要压缩

四、完整练习代码（基于Day1/2/3扩展）

前置依赖

沿用前几日所有依赖：aiohttp、pydantic、faiss-cpu、numpy、fastapi、uvicorn,最后总结提示词有bug需要提示词里加前置任务的结果

1. 任务规划核心模块 task_planner.py

CSDN-OPC开发者社区

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容，并连接云服务、办公空间等稀缺资源，助你专注创造，无忧运营。

更多推荐

《LangGraph 开发AI Agent 实践》—— 手把手教你构建有状态的复杂工作流智能体

CSDN-OPC开发者社区

Agentic Skill Routing 实战：别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活，长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”，而是另一个问题：Skill 能不能像知识库一样被 Agent 主动检索？常用能力保持在手边，长尾能力先放进冷存储；需要时，Agent 自己搜索、检查证据、确认选择，再把对应 Skill 拉回来执行。这其实就是。

CSDN-OPC开发者社区

2026年最值得学的技术——AI Agent完全指南：从小白到实战

AI Agent完全指南（150字摘要） AI Agent是2026年最具潜力的技术方向，能够自主完成任务而非仅回答问题。本文提供从入门到实战的完整路径：首先解释AI Agent的四大核心能力（感知、规划、行动、记忆）及其与传统AI的区别；推荐3款零门槛工具（Cursor、Coze、Dify）帮助小白快速上手；展示5个实用场景如自动日报、智能客服等；并给出Python开发AI Agent的实现思路