生产级语音AI:SIP电话系统 LiveKit AWS Docker Python

 

Production Voice AI: SIP Telephony LiveKit AWS Docker Python

 

发布时间:2026年2月

视频格式:MP4

 语言:英语 | 时长:80节课(3小时) | 大小:1.8GB

 

基于SIP电话(+91)、LiveKit、AWS EC2和Docker,打造可商用的语音AI智能体,支持呼入与外呼。

 

你将学到

 

- 设计融合PSTN、SIP、LiveKit与AWS的生产级语音AI架构。

- 与真实电信运营商配置呼入、呼出SIP中继。

- 使用VoBiz AI(印度电信服务商)配置真实印度DID号码。

- 通过Docker容器在AWS EC2(Ubuntu)上部署语音AI智能体。

- 实现完整的STT→LLM→TTS实时语音交互流程。

- 搭建并测试对接真实DID号码的AI呼入投诉台系统。

- 开发并触发用于自动外呼营销的AI外呼系统。

- 集成LiveKit实现实时媒体流与SIP通话路由。

- 配置Deepgram、OpenAI、Cartesia、Sarvam TTS等API集成。

- 通过调整TTS语速、音高与性能参数优化语音响应。

- 分析语音AI系统的扩展性、并发限制与生产环境性能。

 

前置要求

 

- Python编程基础

- 熟悉Linux/Ubuntu命令行

- 云计算基础知识(AWS基础)

- 了解API与环境变量

- 可运行Docker与SSH工具的电脑

 

课程简介

 

在本课程中,你将设计并部署一套完整的生产级语音AI系统,包括:

 

- 用于眼科医院的真实AI外呼系统

- 用于监控与管理通话的集中式语音AI控制台

- 在AWS EC2(Ubuntu)上完整部署的语音AI智能体

- 基于Docker的容器化架构

- 与真实电信服务商端到端SIP中继集成

- 使用LiveKit实现实时媒体路由

- 用于实时语音智能的完整STT→LLM→TTS流程

- 可支持并发通话的可扩展基础设施

 

课程结束后,你将拥有一套完整可用、对接电信、可在生产环境接听与拨打真实电话的AI语音系统。

 

课程大纲

 

课程介绍:实时语音AI系统

 

- 实时演示——投诉台呼入

- 实时演示——眼科医院外呼

- 实时演示——语音AI控制台

- 本课程你将构建的内容

- 本语音AI课程的特色

- 端到端通话流程

 

语音AI与SIP电话基础

 

- 本模块学习内容

- 理解PSTN(公共交换电话网)

- 什么是SIP(会话初始协议)

- PSTN与SIP对比

- 呼入通话流程

- 呼出通话流程

- 呼入流程中的SIP中继

- 呼出流程中的SIP中继

- 理解SIP凭证

- 生产级AI语音系统工作原理

 

语音AI智能体的AWS基础设施与服务器配置

 

- 本模块学习内容

- Ubuntu EC2服务器(语音AI智能体服务器)

- 创建Ubuntu EC2实例

- 通过MobaXterm访问服务器

- Ubuntu AI服务器(STT→LLM→TTS)

- 语音AI智能体Docker配置

 

语音AI智能体代码开发

 

- 语音AI智能体代码概述

- 语音AI智能体脚本深度解析(一)

- 语音AI智能体脚本深度解析(二)

- 语音AI智能体脚本深度解析(三)

- 语音AI智能体脚本深度解析(四)

 

API密钥配置(STT→LLM→TTS)

 

- Deepgram、OpenAI与Cartesia API密钥

 

为什么使用LiveKit

 

- 什么是LiveKit

- 本AI项目为何使用LiveKit

- LiveKit文档概览

- LiveKit解决的问题

- LiveKit账号与API配置

 

提示词、依赖项与Dockerfile配置

 

- 为语音AI智能体开发提示词

- Python必需依赖

- 为语音AI智能体构建Dockerfile

 

在Docker容器中运行语音AI智能体

 

- 使用Dockerfile构建镜像

- 在Docker容器中启动语音AI智能体

- 通过LiveKit测试场测试语音AI智能体

 

语音AI智能体之Sarvam AI TTS(文本转语音)

 

- Sarvam AI Bulbul V3 TTS概述

- 将Sarvam TTS集成到语音智能体

- 为LiveKit智能体添加Sarvam AI插件

- 重新构建语音智能体Docker镜像

- 在Docker容器中重新启动语音AI智能体

- 添加Sarvam API并测试新语音

 

通过SIP连接AI语音智能体

 

- 基于SIP的AI语音智能体集成

- SIP服务商选择

 

VoBiz AI账号配置与DID开通(电信服务商)

 

- 在VoBiz AI创建账号

- 购买DID号码

- VoBiz AI DID支持10路并发通话

 

电信层呼入SIP中继

 

- 创建呼入中继

- 创建主叫URI

- 将DID号码绑定到呼入中继

- 在入口点添加智能体名称(agent.py)

- 重新构建并启动容器

 

LiveKit内呼入SIP中继配置

 

- LiveKit:呼入SIP中继设置

- 创建呼入中继

- 拨打DID号码测试语音AI智能体

 

为眼科医院搭建外呼语音AI系统

 

- 外呼通话流程完整概览

- 创建外呼SIP中继

- 在LiveKit中创建外呼中继

- 项目概览——外呼AI呼叫系统

- 智能体创建——agent.py

- 项目文件配置——提示词与依赖

- Dockerfile配置

- 构建语音AI智能体Docker镜像

- 运行语音AI智能体容器

- 创建Python环境

- 安装Python依赖

- 触发外呼

 

语音优化与最终通话测试

 

- 修改TTS语速与音高

- 重新触发外呼

 

通话承载能力与扩展性

 

- 本模块学习内容

- 系统架构概览

- Vobiz AI通道分配(电信服务商)

- EC2实例配置——c6i.xlarge

- 实时测试结果

- 理论与实际限制

- 性能可能下降的场景

- 最后一课

 

适合人群

 

- 希望构建真实电话AI系统的AI与后端开发者

- 在AWS上用Docker部署AI的DevOps工程师

- 探索AI呼叫自动化的电信/VoIP从业者

- 打造AI呼叫解决方案的初创公司创始人

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐