AI Agent 热门词汇全解析:一文搞懂 Agent、MCP、RAG、A2A 等核心概念
文章目录
前言
这篇文章梳理了当前网络上最热门的 AI Agent 相关词汇,帮你搞清楚 Agent、MCP、RAG、Tool Call、Memory、Planning、Multi-Agent、A2A 等概念的真实含义和关系,读完你能对 Agentic AI 的整体架构有一个清晰的认知。
AI Agent 这两年火得一塌糊涂。但随之而来的是大量新词汇,让人看得云里雾里。这些词到底是什么意思?它们之间有什么关系?这篇文章带你一次搞清楚。
一、Agent:会自己干活的 AI
Agent 是整个生态的核心词。
普通的 AI 对话模式是这样的:你问一句,它答一句,完事。
Agent 不一样。它能:
- 接收一个目标(比如"帮我调研竞品并写报告")
- 自己拆解任务
- 调用工具去执行
- 根据结果调整下一步
- 直到任务完成
Agent = LLM + 工具调用 + 循环执行 + 决策能力
你可以把它理解成一个"会自己想办法干活的 AI 员工",而不是一个"等着回答问题的 AI 助手"。
二、Tool Call:Agent 的手
Agent 光靠语言模型本身做不了太多事。它需要工具。
Tool Call(工具调用) 就是让 LLM 能够调用外部功能的机制。
你定义一个工具,比如:
{
"name": "search_web",
"description": "搜索互联网获取最新信息",
"parameters": {
"query": { "type": "string" }
}
}
把这个定义传给模型,模型在合适的时候会输出一个结构化的"我要调用这个工具"的指令。你的代码接收到后,真正去执行搜索,把结果返回给模型,模型继续处理。
常见工具类型:
- 搜索(web search)
- 代码执行(code execution)
- 文件读写
- 数据库查询
- 发邮件、发消息
Tool Call 是 Agent 的"手"。没有工具,Agent 只能说话,不能干活。
三、Planning:Agent 的大脑
光有手还不够,还得有脑子。
Planning(规划) 是指 Agent 在执行任务前,把一个复杂目标分解成一步步可执行的子任务的能力。
常见的规划模式:
ReAct(Reasoning + Acting)
思考 → 行动 → 观察 → 思考 → 行动 → ...
模型先想"我应该怎么做",再调用工具,看到结果,再想下一步。这是目前最主流的 Agent 执行模式。
Chain of Thought(思维链)
让模型在回答前一步一步写出推理过程,提升复杂任务的准确性。
Tree of Thought
把每一步的可能性展开成一棵树,探索多条路径,选最优的。
Planning 决定了 Agent 能不能把一个复杂任务做对、做完。
四、Memory:Agent 的记性
每次对话都是全新开始?那 Agent 肯定没法做长期任务。
Memory(记忆) 是让 Agent 记住信息的机制,分几种:
| 类型 | 说明 | 举例 |
|---|---|---|
| 短期记忆 | 当前对话的上下文 | 这次会话里说过的话 |
| 长期记忆 | 持久化存储,跨会话 | 用户偏好、历史记录 |
| 工作记忆 | 任务执行中的中间状态 | 当前搜索结果、已完成步骤 |
| 语义记忆 | 向量化的知识库 | 文档、FAQ |
Agent 通常把长期记忆写到文件或数据库里,每次启动时读取,相当于给 AI 一个"记事本"。
没有记忆的 Agent 就像每天醒来都失忆的员工,永远从零开始。
五、RAG:让 AI 看到你的私有数据
RAG(Retrieval-Augmented Generation,检索增强生成) 解决的是一个核心问题:LLM 的训练数据有截止日期,而且不包含你的私有数据。
RAG 的流程:
用户问题
↓
向量化 → 在知识库里搜索相似内容
↓
把检索结果塞进 prompt
↓
LLM 基于这些内容生成回答
比如你有公司内部文档 1000 份,你不可能全塞进 context window,但可以:
- 把文档切片,向量化存进向量数据库
- 用户提问时,找出最相关的几段
- 把这几段+用户问题一起发给 LLM
RAG = 让 LLM 带着"参考资料"回答问题,而不是靠记忆裸答。
它和 Memory 的区别:RAG 面向的是外部知识库,Memory 面向的是 Agent 自身的经验积累。
六、MCP:让工具标准化
不同 Agent 框架、不同工具都有自己的接口格式,互不兼容。这是开发者的噩梦。
MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 在 2024 年底推出的开放协议,目标是统一 AI 应用和工具/数据源的连接方式。
类比一下:USB 之前,每个设备都有自己的接口,乱成一锅粥。USB 出来之后,统一了。MCP 想对 AI 工具做同样的事。
MCP 的架构:
MCP Client(你的 Agent)
↕ MCP Protocol
MCP Server(工具提供方)
- GitHub MCP Server
- 文件系统 MCP Server
- 数据库 MCP Server
- ...
对开发者的好处:
- 写一个 MCP Server,所有支持 MCP 的 AI 应用都能用
- 不用为每个框架单独适配
目前主流 AI 平台(Claude、OpenAI、Cursor 等)都已支持 MCP。
MCP 就是 AI 世界的 USB 协议——让工具和模型之间的连接变得标准化、可复用。
七、Multi-Agent:多个 Agent 协作
单个 Agent 处理复杂任务有局限:context 不够用、并行效率低、专业度不足。
Multi-Agent(多智能体) 系统让多个 Agent 分工协作:
协调者 Agent(Orchestrator)
├── 研究 Agent → 搜索、收集信息
├── 写作 Agent → 生成内容
├── 审核 Agent → 检查质量
└── 执行 Agent → 调用 API、操作系统
典型模式:
主从模式:一个主 Agent 负责规划,把子任务分配给专门的 Agent 执行。
流水线模式:Agent A 的输出是 Agent B 的输入,像工厂流水线。
竞争模式:多个 Agent 同时尝试解决问题,选最好的结果。
Multi-Agent 就是让 AI 学会团队合作,用分工解决一个 Agent 搞不定的复杂任务。
八、A2A:Agent 之间怎么说话
多个 Agent 协作,就需要通信标准。
A2A(Agent-to-Agent Protocol) 是 Google 在 2025 年推出的协议,专门定义 Agent 之间如何通信、协作、交换任务。
和 MCP 的区别:
| MCP | A2A | |
|---|---|---|
| 连接对象 | Agent ↔ 工具/数据源 | Agent ↔ Agent |
| 方向 | 垂直(调用下层资源) | 水平(平级协作) |
| 推出方 | Anthropic |
两者是互补关系,不是竞争关系。一个健全的 Multi-Agent 系统里,可以同时用 MCP 连接工具,用 A2A 协调 Agent 之间的任务。
A2A 解决的是"Agent 们怎么分工"的问题,MCP 解决的是"Agent 怎么用工具"的问题。
九、Agentic AI:一种新的 AI 使用范式
Agentic AI 不是一个具体的技术,而是描述一种 AI 的工作方式。
传统 AI 使用方式:
- 用户输入 → 模型输出 → 结束
Agentic AI 工作方式:
- 给 AI 一个目标 → AI 自主规划 → 循环执行工具调用 → 自我反思和纠错 → 完成任务
"Agentic"强调的是自主性和主动性——AI 不再被动等待,而是主动推进任务。
这背后需要几个条件:
- 足够强的 LLM(能做规划和决策)
- 可靠的工具调用(能真正干活)
- 长上下文和记忆(能处理长任务)
- 可控的反馈机制(不能失控)
Agentic AI 代表了 AI 从"问答工具"向"自主执行者"的转变。
十、全景图:这些词怎么串起来
用户目标
↓
Agentic AI 系统
├── Planning(规划任务)
├── Memory(记住上下文和历史)
├── Tool Call(调用工具)
│ └── 通过 MCP 连接各种工具/数据源
└── RAG(检索知识库)
如果是 Multi-Agent:
├── Orchestrator Agent(协调)
└── Worker Agents(专项执行)
└── 通过 A2A 协议通信
简单记忆法:
- 干什么:Agent
- 怎么干:Planning
- 用什么干:Tool Call + MCP
- 记住了什么:Memory
- 知识从哪来:RAG
- 多人协作:Multi-Agent + A2A
- 整体范式:Agentic AI
结语
这些词本质上都是在描述"怎么让 AI 更有效地完成复杂任务"这一件事。掌握这些概念,不只是能在技术讨论里不露怯,更重要的是能帮你判断一个 AI 产品或框架的架构设计是否合理。
下一步推荐:动手用 LangChain4j 或 Claude API 实现一个最简单的 Agent,亲自跑一遍 Tool Call 的循环,比看十篇文章都管用。
下一篇:手把手实现一个 Java Agent——从 Tool Call 到 Multi-Agent 编排
更多推荐
所有评论(0)