前言

这篇文章梳理了当前网络上最热门的 AI Agent 相关词汇,帮你搞清楚 Agent、MCP、RAG、Tool Call、Memory、Planning、Multi-Agent、A2A 等概念的真实含义和关系,读完你能对 Agentic AI 的整体架构有一个清晰的认知。

AI Agent 这两年火得一塌糊涂。但随之而来的是大量新词汇,让人看得云里雾里。这些词到底是什么意思?它们之间有什么关系?这篇文章带你一次搞清楚。


一、Agent:会自己干活的 AI

Agent 是整个生态的核心词。

普通的 AI 对话模式是这样的:你问一句,它答一句,完事。

Agent 不一样。它能:

  1. 接收一个目标(比如"帮我调研竞品并写报告")
  2. 自己拆解任务
  3. 调用工具去执行
  4. 根据结果调整下一步
  5. 直到任务完成

Agent = LLM + 工具调用 + 循环执行 + 决策能力

你可以把它理解成一个"会自己想办法干活的 AI 员工",而不是一个"等着回答问题的 AI 助手"。


二、Tool Call:Agent 的手

Agent 光靠语言模型本身做不了太多事。它需要工具

Tool Call(工具调用) 就是让 LLM 能够调用外部功能的机制。

你定义一个工具,比如:

{
  "name": "search_web",
  "description": "搜索互联网获取最新信息",
  "parameters": {
    "query": { "type": "string" }
  }
}

把这个定义传给模型,模型在合适的时候会输出一个结构化的"我要调用这个工具"的指令。你的代码接收到后,真正去执行搜索,把结果返回给模型,模型继续处理。

常见工具类型:

  • 搜索(web search)
  • 代码执行(code execution)
  • 文件读写
  • 数据库查询
  • 发邮件、发消息

Tool Call 是 Agent 的"手"。没有工具,Agent 只能说话,不能干活。


三、Planning:Agent 的大脑

光有手还不够,还得有脑子。

Planning(规划) 是指 Agent 在执行任务前,把一个复杂目标分解成一步步可执行的子任务的能力。

常见的规划模式:

ReAct(Reasoning + Acting)

思考 → 行动 → 观察 → 思考 → 行动 → ...

模型先想"我应该怎么做",再调用工具,看到结果,再想下一步。这是目前最主流的 Agent 执行模式。

Chain of Thought(思维链)

让模型在回答前一步一步写出推理过程,提升复杂任务的准确性。

Tree of Thought

把每一步的可能性展开成一棵树,探索多条路径,选最优的。

Planning 决定了 Agent 能不能把一个复杂任务做对、做完。


四、Memory:Agent 的记性

每次对话都是全新开始?那 Agent 肯定没法做长期任务。

Memory(记忆) 是让 Agent 记住信息的机制,分几种:

类型 说明 举例
短期记忆 当前对话的上下文 这次会话里说过的话
长期记忆 持久化存储,跨会话 用户偏好、历史记录
工作记忆 任务执行中的中间状态 当前搜索结果、已完成步骤
语义记忆 向量化的知识库 文档、FAQ

Agent 通常把长期记忆写到文件或数据库里,每次启动时读取,相当于给 AI 一个"记事本"。

没有记忆的 Agent 就像每天醒来都失忆的员工,永远从零开始。


五、RAG:让 AI 看到你的私有数据

RAG(Retrieval-Augmented Generation,检索增强生成) 解决的是一个核心问题:LLM 的训练数据有截止日期,而且不包含你的私有数据。

RAG 的流程:

用户问题
   ↓
向量化 → 在知识库里搜索相似内容
   ↓
把检索结果塞进 prompt
   ↓
LLM 基于这些内容生成回答

比如你有公司内部文档 1000 份,你不可能全塞进 context window,但可以:

  1. 把文档切片,向量化存进向量数据库
  2. 用户提问时,找出最相关的几段
  3. 把这几段+用户问题一起发给 LLM

RAG = 让 LLM 带着"参考资料"回答问题,而不是靠记忆裸答。

它和 Memory 的区别:RAG 面向的是外部知识库,Memory 面向的是 Agent 自身的经验积累。


六、MCP:让工具标准化

不同 Agent 框架、不同工具都有自己的接口格式,互不兼容。这是开发者的噩梦。

MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 在 2024 年底推出的开放协议,目标是统一 AI 应用和工具/数据源的连接方式。

类比一下:USB 之前,每个设备都有自己的接口,乱成一锅粥。USB 出来之后,统一了。MCP 想对 AI 工具做同样的事。

MCP 的架构:

MCP Client(你的 Agent)
      ↕ MCP Protocol
MCP Server(工具提供方)
   - GitHub MCP Server
   - 文件系统 MCP Server  
   - 数据库 MCP Server
   - ...

对开发者的好处:

  • 写一个 MCP Server,所有支持 MCP 的 AI 应用都能用
  • 不用为每个框架单独适配

目前主流 AI 平台(Claude、OpenAI、Cursor 等)都已支持 MCP。

MCP 就是 AI 世界的 USB 协议——让工具和模型之间的连接变得标准化、可复用。


七、Multi-Agent:多个 Agent 协作

单个 Agent 处理复杂任务有局限:context 不够用、并行效率低、专业度不足。

Multi-Agent(多智能体) 系统让多个 Agent 分工协作:

协调者 Agent(Orchestrator)
    ├── 研究 Agent → 搜索、收集信息
    ├── 写作 Agent → 生成内容
    ├── 审核 Agent → 检查质量
    └── 执行 Agent → 调用 API、操作系统

典型模式:

主从模式:一个主 Agent 负责规划,把子任务分配给专门的 Agent 执行。

流水线模式:Agent A 的输出是 Agent B 的输入,像工厂流水线。

竞争模式:多个 Agent 同时尝试解决问题,选最好的结果。

Multi-Agent 就是让 AI 学会团队合作,用分工解决一个 Agent 搞不定的复杂任务。


八、A2A:Agent 之间怎么说话

多个 Agent 协作,就需要通信标准。

A2A(Agent-to-Agent Protocol) 是 Google 在 2025 年推出的协议,专门定义 Agent 之间如何通信、协作、交换任务。

和 MCP 的区别:

MCP A2A
连接对象 Agent ↔ 工具/数据源 Agent ↔ Agent
方向 垂直(调用下层资源) 水平(平级协作)
推出方 Anthropic Google

两者是互补关系,不是竞争关系。一个健全的 Multi-Agent 系统里,可以同时用 MCP 连接工具,用 A2A 协调 Agent 之间的任务。

A2A 解决的是"Agent 们怎么分工"的问题,MCP 解决的是"Agent 怎么用工具"的问题。


九、Agentic AI:一种新的 AI 使用范式

Agentic AI 不是一个具体的技术,而是描述一种 AI 的工作方式。

传统 AI 使用方式:

  • 用户输入 → 模型输出 → 结束

Agentic AI 工作方式:

  • 给 AI 一个目标 → AI 自主规划 → 循环执行工具调用 → 自我反思和纠错 → 完成任务

"Agentic"强调的是自主性主动性——AI 不再被动等待,而是主动推进任务。

这背后需要几个条件:

  1. 足够强的 LLM(能做规划和决策)
  2. 可靠的工具调用(能真正干活)
  3. 长上下文和记忆(能处理长任务)
  4. 可控的反馈机制(不能失控)

Agentic AI 代表了 AI 从"问答工具"向"自主执行者"的转变。


十、全景图:这些词怎么串起来

用户目标
    ↓
Agentic AI 系统
    ├── Planning(规划任务)
    ├── Memory(记住上下文和历史)
    ├── Tool Call(调用工具)
    │       └── 通过 MCP 连接各种工具/数据源
    └── RAG(检索知识库)

如果是 Multi-Agent:
    ├── Orchestrator Agent(协调)
    └── Worker Agents(专项执行)
            └── 通过 A2A 协议通信

简单记忆法:

  • 干什么:Agent
  • 怎么干:Planning
  • 用什么干:Tool Call + MCP
  • 记住了什么:Memory
  • 知识从哪来:RAG
  • 多人协作:Multi-Agent + A2A
  • 整体范式:Agentic AI

结语

这些词本质上都是在描述"怎么让 AI 更有效地完成复杂任务"这一件事。掌握这些概念,不只是能在技术讨论里不露怯,更重要的是能帮你判断一个 AI 产品或框架的架构设计是否合理。

下一步推荐:动手用 LangChain4j 或 Claude API 实现一个最简单的 Agent,亲自跑一遍 Tool Call 的循环,比看十篇文章都管用。

下一篇:手把手实现一个 Java Agent——从 Tool Call 到 Multi-Agent 编排


Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐