从部署到搭建：Dify 实战玩转私有化 AI 智能体

Dify是面向开发者的开源LLM应用开发平台，定位“生成式AI应用创新引擎”，以低代码/无代码提供模型集成、工作流编排到部署的全流程管理，降低企业级AI应用开发门槛。开源LLM应用开发平台Dify（面向开发者），定位“生成式AI应用创新引擎”，凭低代码/无代码覆盖全流程管理，助力降低企业级AI应用开发门槛。 Dify是开发者友好的开源LLM应用平台，以“生成式AI应用创新引擎”为定位，通过低代码

编程唐小宝

2147人浏览 · 2025-08-27 23:30:00

编程唐小宝 · 2025-08-27 23:30:00 发布

什么是dify

Dify是面向开发者的开源LLM应用开发平台，定位“生成式AI应用创新引擎”，以低代码/无代码提供模型集成、工作流编排到部署的全流程管理，降低企业级AI应用开发门槛。
开源LLM应用开发平台Dify（面向开发者），定位“生成式AI应用创新引擎”，凭低代码/无代码覆盖全流程管理，助力降低企业级AI应用开发门槛。
Dify是开发者友好的开源LLM应用平台，以“生成式AI应用创新引擎”为定位，通过低代码/无代码打通全流程，降低企业级AI开发门槛。

dify 的核心特点

• 提供拖拽式工作流编排（如 Prompt 设计、Agent 构建），支持非技术人员快速定义 AI 应用逻辑，无需深入底层代码179。
• 内置 Prompt IDE，可调试提示词、对比模型性能，并集成文本转语音等扩展功能9。
• 强大的模型兼容性
支持数百种主流模型（如 GPT-4、DeepSeek、Llama3、通义千问），兼容 OpenAI API 协议，可灵活切换云端或本地私有模型1610。
• 通过 OneAPI 协议动态路由请求，优化模型调用成本610。
• 企业级 RAG 引擎
支持长文档解析（PDF/PPT 等），结合向量数据库（如 Milvus）和混合检索（关键词+语义），提升知识库问答准确性178。
• 支持引用溯源和人工干预，减少模型“幻觉
• 灵活的 Agent 框架
基于 ReAct 策略（推理+行动），可调用 50+ 内置工具（如谷歌搜索、DALL·E），或自定义 API 扩展复杂任务处理能力79。
• 全链路 LLMOps 支持
提供模型监控、日志分析、A/B 测试等功能，支持 Kubernetes 私有化部署，满足金融、医疗等高合规场景3710。

dify的版本

云版本：

私有化部署版本：

Dify vs Coze：核心优势对比

维度	Dify	Coze
定位	面向开发者/企业，支持复杂 AI 应用开发	面向普通用户，侧重快速搭建对话机器人
模型支持	多模型混合调用 + 私有化部署	主要依赖字节系模型（豆包），不支持自定义
知识库能力	长文本处理、RAG 优化、高精度检索	单文件仅支持 6000 Token，需手动分割
数据安全	全链路私有化部署，数据本地化	依赖云端服务，存在隐私风险
扩展性	自定义工具/代码节点，复杂工作流编排	模块简化，高级定制受限
适用场景	企业级应用（客服/BI/合规分析）	C 端场景（抖音/飞书聊天机器人）

场景选型建议

• 选 Dify：需复杂工作流（如合同分析 + 多模型调度）、数据隐私要求高、长期企业级应用。
• 选 Coze：快速嵌入字节生态（抖音/飞书）、轻量级对话机器人开发、无代码需求。

dify的私有化部署

部署步骤

1、克隆dify社区版源码到本地

git 
clone
 https://github.com/langgenius/dify.git

2、进入 Dify 源代码的 Docker 目录

cd
 dify/docker


复制环境配置文件


cp
 .env.example .
env


# windows cmd


# copy .env.example .env

3、启动源码中的docker-compose.yaml，此命令会自动拉取配置好的镜像并启动容器

docker compose up

注意：一开始不要使用docker compose up -d , 因为-d表示后台执行，如果pull镜像网络超时则会立刻中断，国内pull镜像不太稳定，经常中断，后面可以拉完镜像后，再次启动才加上-d参数后台运行

4、最后检查是否所有容器都正常运行：

docker compose ps

显示运行中的容器:

管理界面和配置

浏览器输入：http://localhost/install
打开配置界面，配置登录邮箱和账号名、密码后，登录后打开主界面：

后续输入http://localhost 打开主界面即可

大模型供应商配置：
打开右上角登录头像，点击“设置”，可以选择大模型供应商：

接入deepseek:

这里直接选择安装deepseek后，在配置列表设置deepseek 的api key，配置成功之后则可以在工作流节点中使用了

接入本地的Ollama模型：
这里主要配置了部署bge-3的embedding模型

注意：配置本地Ollama的基础URL，ip不能是localhost，需要是本地的局域网ip，例如：http://192.168.3.202:11434，端口默认是11434，这是因为dify是docker启动的，localhost是容器内的地址了，不是本地宿主机的

搭建AI智能体

下面以OA行政小助手为例，搭建一个AI智能体，用于使用自然语文查询公司员工手册、用户信息以及公司部门信息等，支持RAG和工具调用

创建应用

创建空白应用，应用类型选择“Chatflow”, chatflow 基于工作流编排，适用于定义等复杂流程的多轮对话场景，具有记忆功能

准备工作

创建知识库

导入到知识库的文本，这里将后面要检索的《员工手册》导入到知识库：

文本分段和清洗：

设置分段长度和重叠长度，embedding模型这里使用本地Ollama部署的bge-3模型

保存处理成功后，就可以在知识库看到新增的内容：

创建知识库查询工作流

工作流编排如下：

然后点击右上角发布-发布为工具，将此工作流发布为工具，在“工具”中就可以看到

这个主要用于后面做为工具绑定到智能体的工具列表中，dify没有官方的检索知识库插件，故这里自己创建一个工作流来查询知识库，同时把这个工作流发布为插件后，就可以在智能体节点绑定成工具使用

安装数据库查询工具

右上角点击插件-安装插件-安装源-Marketplace, 搜索数据库查询，安装“数据库查询”工具

后面作为智能体查询指定的数据库查询工具

安装AGENT策略

这个AGENT策略需要在插件市场进行安装，右上角点击插件-安装插件-安装源-Marketplace, 搜索AGENT策略，安装“Dify Agent策略”

AGENT策略为后面创建智能体提供策略的处理支持

编排流程

编排如下：

这里添加三个节点开始、AGENT、直接回复：

开始节点：

这里的sys.query字段为用户聊天的输入消息

AGENT节点：

主要的智能体处理节点：

AGENT策略：
选择ReAct，支持多轮迭代调用工具处理，得出最佳的回复

工具列表：
1、查询知识库
2、SQL查询

这里绑定了前面准备好的两个工具

数据库工具这里可以配置的连接属性：

这里的属性值在dify环境变量已经配置好，直接选择就好

指令：
指令就是设定系统提示词：

<
instruction
>


你是一个OA小助手，专门用于查询公司员工手册、用户信息以及公司部门信息。请按照以下步骤处理用户的请求：




1. **明确查询类型**：首先确定用户需要查询的是员工手册、用户信息还是部门信息。如果是员工手册，直接返回相关章节或全文；如果是用户或部门信息，需确认查询的具体内容（如姓名、工号、部门名称等）。




2. **精准匹配数据**：根据用户提供的查询条件，从数据库中检索最匹配的结果。若用户提供的信息不完整，可请求进一步澄清。




3. **格式化输出**：将结果以清晰、简洁的文本形式返回，避免使用任何XML标签或其他标记语言。确保信息易于阅读和理解。




4. **处理模糊请求**：如果用户查询的内容不明确或存在多个可能的结果，列出所有可能的选项并提示用户进一步筛选。




5. **错误处理**：若未找到匹配结果，需明确告知用户并建议调整查询条件。




请始终以专业、友好的态度回应用户，确保信息的准确性和及时性。


</
instruction
>




<
examples
>


<
example
>


输入：查询员工手册中的请假政策  


输出：员工手册中关于请假政策的规定如下：  


1. 年假：员工每年享有15天带薪年假。  


2. 病假：需提供医院证明，每年最多30天。  


3. 事假：需提前申请，无薪。  


更多详情请参考手册第5章第2节。


</
example
>




<
example
>


输入：查询张三的部门信息  


输出：张三隶属于技术部，职位为高级软件工程师，工号为TECH2023。


</
example
>




<
example
>


输入：查询市场部的所有员工  


输出：市场部现有员工如下：  


1. 李四 - 市场经理  


2. 王五 - 市场专员  


3. 赵六 - 品牌策划  


如需详细信息，请提供具体员工姓名。


</
example
>


</
examples
>




<
note
>


1. 所有输出必须为纯文本，不得包含任何XML标签或特殊格式。  


2. 若用户未提供足够信息，应主动询问而非猜测。  


3. 对于敏感信息（如薪资、联系方式等），需验证用户权限后再提供。  


4. 保持回答简洁，避免冗长。


5. OA数据库表结构为：


-- department definition


CREATE TABLE `department` (


  `id` INT PRIMARY KEY AUTO_INCREMENT,


  `name` VARCHAR(255) NOT NULL COMMENT '部门名称',


  `parent_id` INT COMMENT '上级部门ID',


  `manager_id` INT COMMENT '部门负责人ID',


  `create_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',


  `edit_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',


  UNIQUE KEY `uniq_department_name` (`name`)


) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='部门表';




-- employee definition


CREATE TABLE `employee` (


  `id` INT PRIMARY KEY AUTO_INCREMENT,


  `employee_no` VARCHAR(255) NOT NULL COMMENT '员工编号',


  `name` VARCHAR(255) NOT NULL COMMENT '姓名',


  `gender` TINYINT NOT NULL DEFAULT 0 COMMENT '0-未知 1-男 2-女',


  `birth_date` DATE COMMENT '出生日期',


  `phone` VARCHAR(50) NOT NULL COMMENT '联系电话',


  `email` VARCHAR(255) NOT NULL COMMENT '电子邮箱',


  `department_id` INT NOT NULL COMMENT '所属部门',


  `position` VARCHAR(255) NOT NULL COMMENT '当前职位',


  `entry_date` DATE NOT NULL COMMENT '入职日期',


  `status` TINYINT NOT NULL DEFAULT 2 COMMENT '1-试用 2-在职 3-离职',


  `create_time` DATETIME DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',


  `edit_time` DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',


  UNIQUE KEY `uniq_employee_no` (`employee_no`)


) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='员工表';


</
note
>

提示词列出了OA数据库的表结构，帮助LLM理解跟组装查询SQL

直接回复节点：

回复选择上个节点AGENT的输出结果text

预览

点击预览弹出预览聊天界面，输入聊天消息就可以和编排好的智能体聊天了

工具调用：

比如查询“小明的员工资料”：

智能体会感知用户的查询意图，自动调用数据库查询工具查询小明的员工表和部门表，最终得出结果，这里可以看到这里经过三轮的步骤，round 1查询员工表，round 2 查询部门表，round 3 再由大模型总结输出最终的结果

知识库检索：

比如查询“公司的考勤制度”

智能体会使用知识库查询工具，自动去检索知识库，然后总结出最终的输出

发布运行

可以将智能体聊天界面发布成web站点，方便外部进行访问

“发布更新”后，点击“运行”可以打开web站点：

预览

点击预览弹出预览聊天界面，输入聊天消息就可以和编排好的智能体聊天了

工具调用：

比如查询“小明的员工资料”：

[外链图片转存中…(img-0E87Wmrr-1756292728193)]

[外链图片转存中…(img-wHSiDpDS-1756292728193)]

知识库检索：

比如查询“公司的考勤制度”

[外链图片转存中…(img-Usssec9L-1756292728193)]

智能体会使用知识库查询工具，自动去检索知识库，然后总结出最终的输出

发布运行

可以将智能体聊天界面发布成web站点，方便外部进行访问

[外链图片转存中…(img-nh9Dw5Op-1756292728193)]

“发布更新”后，点击“运行”可以打开web站点：

读者福利大放送：如果你对大模型感兴趣，想更加深入的学习大模型**，那么这份精心整理的大模型学习资料，绝对能帮你少走弯路、快速入门**

如果你是零基础小白，别担心——大模型入门真的没那么难，你完全可以学得会！

👉 不用你懂任何算法和数学知识，公式推导、复杂原理这些都不用操心；
👉 也不挑电脑配置，普通家用电脑完全能 hold 住，不用额外花钱升级设备；
👉 更不用你提前学 Python 之类的编程语言，零基础照样能上手。

你要做的特别简单：跟着我的讲解走，照着教程里的步骤一步步操作就行。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

现在这份资料免费分享给大家，有需要的小伙伴，直接VX扫描下方二维码就能领取啦😝↓↓↓
在这里插入图片描述

为什么要学习大模型？

数据显示，2023 年我国大模型相关人才缺口已突破百万，这一数字直接暴露了人才培养体系的严重滞后与供给不足。而随着人工智能技术的飞速迭代，产业对专业人才的需求将呈爆发式增长，据预测，到 2025 年这一缺口将急剧扩大至 400 万！!
在这里插入图片描述

大模型学习路线汇总

整体的学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战，跟着学习路线一步步打卡，小白也能轻松学会！
在这里插入图片描述

大模型实战项目&配套源码

光学理论可不够，这套学习资料还包含了丰富的实战案例，让你在实战中检验成果巩固所学知识
在这里插入图片描述

大模型学习必看书籍PDF

我精选了一系列大模型技术的书籍和学习文档(电子版)，它们由领域内的顶尖专家撰写，内容全面、深入、详尽，为你学习大模型提供坚实的理论基础。
在这里插入图片描述

大模型超全面试题汇总

在面试过程中可能遇到的问题，我都给大家汇总好了，能让你们在面试中游刃有余
在这里插入图片描述

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述
👉获取方式：