AI Agent 热门词汇全解析：一文搞懂 Agent、MCP、RAG、A2A 等核心概念

学计算机的计算基

487人浏览 · 2026-06-16 18:30:43

学计算机的计算基 · 2026-06-16 18:30:43 发布

文章目录

前言

这篇文章梳理了当前网络上最热门的 AI Agent 相关词汇，帮你搞清楚 Agent、MCP、RAG、Tool Call、Memory、Planning、Multi-Agent、A2A 等概念的真实含义和关系，读完你能对 Agentic AI 的整体架构有一个清晰的认知。

AI Agent 这两年火得一塌糊涂。但随之而来的是大量新词汇，让人看得云里雾里。这些词到底是什么意思？它们之间有什么关系？这篇文章带你一次搞清楚。

一、Agent：会自己干活的 AI

Agent 是整个生态的核心词。

普通的 AI 对话模式是这样的：你问一句，它答一句，完事。

Agent 不一样。它能：

接收一个目标（比如"帮我调研竞品并写报告"）
自己拆解任务
调用工具去执行
根据结果调整下一步
直到任务完成

Agent = LLM + 工具调用 + 循环执行 + 决策能力

你可以把它理解成一个"会自己想办法干活的 AI 员工"，而不是一个"等着回答问题的 AI 助手"。

二、Tool Call：Agent 的手

Agent 光靠语言模型本身做不了太多事。它需要工具。

Tool Call（工具调用） 就是让 LLM 能够调用外部功能的机制。

你定义一个工具，比如：

{
  "name": "search_web",
  "description": "搜索互联网获取最新信息",
  "parameters": {
    "query": { "type": "string" }
  }
}

把这个定义传给模型，模型在合适的时候会输出一个结构化的"我要调用这个工具"的指令。你的代码接收到后，真正去执行搜索，把结果返回给模型，模型继续处理。

常见工具类型：

搜索（web search）
代码执行（code execution）
文件读写
数据库查询
发邮件、发消息

Tool Call 是 Agent 的"手"。没有工具，Agent 只能说话，不能干活。

三、Planning：Agent 的大脑

光有手还不够，还得有脑子。

Planning（规划） 是指 Agent 在执行任务前，把一个复杂目标分解成一步步可执行的子任务的能力。

常见的规划模式：

ReAct（Reasoning + Acting）

思考 → 行动 → 观察 → 思考 → 行动 → ...

模型先想"我应该怎么做"，再调用工具，看到结果，再想下一步。这是目前最主流的 Agent 执行模式。

Chain of Thought（思维链）

让模型在回答前一步一步写出推理过程，提升复杂任务的准确性。

Tree of Thought

把每一步的可能性展开成一棵树，探索多条路径，选最优的。

Planning 决定了 Agent 能不能把一个复杂任务做对、做完。

四、Memory：Agent 的记性

每次对话都是全新开始？那 Agent 肯定没法做长期任务。

Memory（记忆） 是让 Agent 记住信息的机制，分几种：

类型	说明	举例
短期记忆	当前对话的上下文	这次会话里说过的话
长期记忆	持久化存储，跨会话	用户偏好、历史记录
工作记忆	任务执行中的中间状态	当前搜索结果、已完成步骤
语义记忆	向量化的知识库	文档、FAQ

Agent 通常把长期记忆写到文件或数据库里，每次启动时读取，相当于给 AI 一个"记事本"。

没有记忆的 Agent 就像每天醒来都失忆的员工，永远从零开始。

五、RAG：让 AI 看到你的私有数据

RAG（Retrieval-Augmented Generation，检索增强生成） 解决的是一个核心问题：LLM 的训练数据有截止日期，而且不包含你的私有数据。

RAG 的流程：

用户问题
   ↓
向量化 → 在知识库里搜索相似内容
   ↓
把检索结果塞进 prompt
   ↓
LLM 基于这些内容生成回答

比如你有公司内部文档 1000 份，你不可能全塞进 context window，但可以：

把文档切片，向量化存进向量数据库
用户提问时，找出最相关的几段
把这几段+用户问题一起发给 LLM

RAG = 让 LLM 带着"参考资料"回答问题，而不是靠记忆裸答。

它和 Memory 的区别：RAG 面向的是外部知识库，Memory 面向的是 Agent 自身的经验积累。

六、MCP：让工具标准化

不同 Agent 框架、不同工具都有自己的接口格式，互不兼容。这是开发者的噩梦。

MCP（Model Context Protocol，模型上下文协议） 是 Anthropic 在 2024 年底推出的开放协议，目标是统一 AI 应用和工具/数据源的连接方式。

类比一下：USB 之前，每个设备都有自己的接口，乱成一锅粥。USB 出来之后，统一了。MCP 想对 AI 工具做同样的事。

MCP 的架构：

MCP Client（你的 Agent）
      ↕ MCP Protocol
MCP Server（工具提供方）
   - GitHub MCP Server
   - 文件系统 MCP Server  
   - 数据库 MCP Server
   - ...

对开发者的好处：

写一个 MCP Server，所有支持 MCP 的 AI 应用都能用
不用为每个框架单独适配

目前主流 AI 平台（Claude、OpenAI、Cursor 等）都已支持 MCP。

MCP 就是 AI 世界的 USB 协议——让工具和模型之间的连接变得标准化、可复用。

七、Multi-Agent：多个 Agent 协作

单个 Agent 处理复杂任务有局限：context 不够用、并行效率低、专业度不足。

Multi-Agent（多智能体） 系统让多个 Agent 分工协作：

协调者 Agent（Orchestrator）
    ├── 研究 Agent → 搜索、收集信息
    ├── 写作 Agent → 生成内容
    ├── 审核 Agent → 检查质量
    └── 执行 Agent → 调用 API、操作系统

典型模式：

主从模式：一个主 Agent 负责规划，把子任务分配给专门的 Agent 执行。

流水线模式：Agent A 的输出是 Agent B 的输入，像工厂流水线。

竞争模式：多个 Agent 同时尝试解决问题，选最好的结果。

Multi-Agent 就是让 AI 学会团队合作，用分工解决一个 Agent 搞不定的复杂任务。

八、A2A：Agent 之间怎么说话

多个 Agent 协作，就需要通信标准。

A2A（Agent-to-Agent Protocol） 是 Google 在 2025 年推出的协议，专门定义 Agent 之间如何通信、协作、交换任务。

和 MCP 的区别：

	MCP	A2A
连接对象	Agent ↔ 工具/数据源	Agent ↔ Agent
方向	垂直（调用下层资源）	水平（平级协作）
推出方	Anthropic	Google

两者是互补关系，不是竞争关系。一个健全的 Multi-Agent 系统里，可以同时用 MCP 连接工具，用 A2A 协调 Agent 之间的任务。

A2A 解决的是"Agent 们怎么分工"的问题，MCP 解决的是"Agent 怎么用工具"的问题。

九、Agentic AI：一种新的 AI 使用范式

Agentic AI 不是一个具体的技术，而是描述一种 AI 的工作方式。

传统 AI 使用方式：

用户输入 → 模型输出 → 结束

Agentic AI 工作方式：

给 AI 一个目标 → AI 自主规划 → 循环执行工具调用 → 自我反思和纠错 → 完成任务

"Agentic"强调的是自主性和主动性——AI 不再被动等待，而是主动推进任务。

这背后需要几个条件：

足够强的 LLM（能做规划和决策）
可靠的工具调用（能真正干活）
长上下文和记忆（能处理长任务）
可控的反馈机制（不能失控）

Agentic AI 代表了 AI 从"问答工具"向"自主执行者"的转变。

十、全景图：这些词怎么串起来

用户目标
    ↓
Agentic AI 系统
    ├── Planning（规划任务）
    ├── Memory（记住上下文和历史）
    ├── Tool Call（调用工具）
    │       └── 通过 MCP 连接各种工具/数据源
    └── RAG（检索知识库）

如果是 Multi-Agent：
    ├── Orchestrator Agent（协调）
    └── Worker Agents（专项执行）
            └── 通过 A2A 协议通信

简单记忆法：

干什么：Agent
怎么干：Planning
用什么干：Tool Call + MCP
记住了什么：Memory
知识从哪来：RAG
多人协作：Multi-Agent + A2A
整体范式：Agentic AI

结语

这些词本质上都是在描述"怎么让 AI 更有效地完成复杂任务"这一件事。掌握这些概念，不只是能在技术讨论里不露怯，更重要的是能帮你判断一个 AI 产品或框架的架构设计是否合理。

下一步推荐：动手用 LangChain4j 或 Claude API 实现一个最简单的 Agent，亲自跑一遍 Tool Call 的循环，比看十篇文章都管用。

下一篇：手把手实现一个 Java Agent——从 Tool Call 到 Multi-Agent 编排

CSDN-OPC开发者社区

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容，并连接云服务、办公空间等稀缺资源，助你专注创造，无忧运营。

更多推荐

AI Agent Harness Engineering 自动化部署实战：一键完成Agent的上线与更新

传统的DevOps主要关注“代码”的全生命周期管理，传统的MLOps主要关注“模型”的全生命周期管理，但AI Agent不仅包含“代码”和“模型”，还包含“Prompt工程”、“Toolkit”、“Memory”、“Planning”等多个独特的组成部分——因此，传统的DevOps和MLOps都无法完全满足AI Agent的全生命周期管理需求，这就催生了Harness AgentOps。而GitO

CSDN-OPC开发者社区

AI Agent Harness Engineering 的降本增效实战：成本分析与优化策略

本文的核心目的是解决AI Agent落地过程中的成本痛点，覆盖从成本拆解、优化策略设计、代码实现到上线运维的全流程，所有方案均经过生产环境验证，可直接复用。本文不涉及Agent的功能开发，专注于Agent之上的管控层（Harness）的设计与实现。本文先通过生活化类比讲解核心概念，再拆解Agent全链路成本构成，然后详细讲解三大核心优化算法的原理与代码实现，最后给出生产环境落地案例、工具推荐与未来

CSDN-OPC开发者社区

项目实训——大数据租房推荐智能体（爬虫部分8）

今天的汇合标志着项目从“单点功能开发”进入了“系统集成测试”阶段。AI Agent 的接入使得复杂的租房决策变得极其简单——用户只需说出需求，系统便能自动完成数据获取、清洗、评分和推荐。优化 Agent 提示词：提高 ReAct 模式下工具调用的准确率。前端联调：将 CLI 的能力移植到 Web 前端界面。评分权重微调：收集真实用户反馈，动态调整 6 个维度的权重系数，使推荐结果更符合人类直觉。