图片

4月25日,百度文心飞桨联合知名数据库 OceanBase ,携手文心飞桨技术伙伴研扬科技、DEEPX、深蕾半导体、算力魔方等智能硬件企业举办的「Agent 时代的存算演进:从碎片化 AI 应用到生产级智能引擎」技术活动顺利落地深圳。活动围绕 Agent 数据底座、文档资产化、智能硬件、OpenClaw 全链路管控与实操工作流展开,集中探讨 Agent 从碎片化应用走向生产级智能引擎的关键路径。

从数据底座到桌面智能体

开源伙伴共探生产级 Agent

Agent 要真正进入企业生产环境,离不开数据底座、应用形态与工程工具链的共同支撑。活动中,OceanBase 开源负责人封仲淹、OceanBase 技术专家郑晓锋、Qoder 高级技术专家周文分别围绕一体化数据引擎、企业 AI 智能化多场景落地、端到端桌面 AI 同事展开分享。

从数据存储、上下文管理,到企业业务系统接入,再到桌面级任务执行,这些分享共同指向一个趋势:Agent 正从“能对话的工具”走向“能进入工作流的系统”。在这一过程中,数据底座决定智能体能否稳定承载业务状态,桌面 AI 与工作流工具则进一步拓展了 Agent 参与真实任务的边界。

左右滑动查看更多

OceanBase 是面向企业核心业务场景的一体化分布式数据库,具备高可用、高性能、强一致、弹性扩展等能力,广泛服务于金融、政务、运营商、互联网等对稳定性与可靠性要求极高的场景。截止2026年4月,OceanBase 在 GitHub上已获得超过 10.1k 星标。

从文档到知识资产

飞桨星河社区的开发者底座

在企业 Agent 落地过程中,第一道门槛往往不是模型是否足够聪明,而是企业知识能否真正进入系统。大量合同、制度、SOP、表格、扫描件与长图,仍停留在邮件附件、本地磁盘和非结构化文档中,难以被稳定引用、统一管理,也难以接入权限、版本与审计链路。

在这场企业 Agent 落地第一公里的探索中,百度飞桨产品运营经理杨有志带来了《OceanBase × PaddleOCR:企业资产进入 Agent 的第一公里》主题分享,重点介绍百度飞桨星河社区如何通过 PaddleOCR、Skills、API 与开发者资源,帮助企业将文档从“静态附件”转化为可解析、可调用、可编排的知识资产。

基于此,百度飞桨于 2026 年 4 月正式发布 PaddleOCR 3.5,将文档解析能力从模型层推进到了更广泛的工程入口:

  • PaddleOCR.js:发布官方浏览器端推理 SDK,支持在浏览器中直接运行 PP-OCRv5,无需后端服务即可完成轻量文字识别,适合前端应用、隐私敏感场景与交互式工具。

  • 多格式文档直通 AI:支持 Word、Excel、PowerPoint 等主流办公文档一键转 Markdown,解析结果同步支持导出 DOCX,让企业文档从"附件"变成 LLM 可直接消费的结构化数据。

  • 全面适配 Transformers 生态:20 个主要模型支持以 Hugging Face Transformers 作为推理后端,开发者可在飞桨框架与 HuggingFace 生态间自由切换,大幅降低跨生态接入成本。

本次分享中重点介绍了 PaddleOCR Skills——将文档理解能力封装成 Agent 可直接调用的标准工具节点。这意味着开发者无需重新封装模型调用逻辑,只需在 Agent 工作流中直接引用对应 Skill,即可将 PaddleOCR 的文档能力接入到任意 LLM 框架或企业自有系统中——这正是星河社区"让开发者少走弯路、快速跑通工程链路"的核心价值体现(已上线clawhub)。

如果说 PaddleOCR 3.5 解决的是“文档能不能被看懂”,那么星河社区解决的就是“开发者能不能快速用起来”。围绕 PaddleOCR 的能力体验与工程接入,星河社区为开发者提供了从在线试用、API 调用到 Agent 工作流集成的一站式入口

1. PaddleOCR 官网体验入口:免费试用、零门槛验证

无需代码、无需部署,即可直接上传文档,体验 PaddleOCR-VL-1.5 的复杂文档解析效果。表格、公式、多栏版面、印章、长图等内容均可实时可视化呈现,帮助开发者快速判断模型能力是否适配自身业务场景。

2. PaddleOCR API 接入:每日免费调用,快速工程化落地

在完成在线体验后,开发者可无缝切换至 API 调用模式,通过 Access Token 将 PaddleOCR 的文档理解能力接入自有系统。

  • PaddleOCR-VL-1.5 API:支持输出结构化 Markdown / JSON,可直接对接 RAG、知识库与 Agent 工作流。

  • PP-OCRv5 API:面向高精度通用文字识别,适配多语言、多版面文档场景。

从官网体验到 API 工程接入,开发者只需一个 Access Token,即可快速完成能力验证与系统集成,让 PaddleOCR 的文档理解能力真正进入业务流程。

  • PaddleOCR 官网-快速体验/API接入 👉 https://aistudio.baidu.com/paddleocr

破软硬壁垒

文心飞桨伙伴共建 OpenClaw 全链路智能管控

当 Agent 从软件系统走向真实世界,硬件能力成为生产级落地不可或缺的一环。在硬件伙伴闪电演讲环节,来自深蕾半导体、研扬科技、算力魔方与 DEEPX 的四位文心飞桨生态伙伴,围绕「破软硬壁垒:百度文心飞桨 x OceanBase 赋能 OpenClaw 的全链路智能管控」展开分享,集中呈现了智能硬件与 Agent 结合的多种可能。

深圳深蕾半导体边缘计算项目负责人农长霖老师从边缘计算与端侧部署视角出发,分享了智能体在真实设备环境中运行所面临的算力、功耗、响应速度与稳定性挑战。在端云协同架构下,简单本地语音交互、目标检测、基于PaddleOCR 识别等任务可在端侧快速响应,复杂业务则按需联动云端大模型,兼顾隐私安全、低时延与稳定运行。

研扬科技(苏州)有限公司华南大区总经理张旭兵老师结合工业硬件与行业终端场景,分享了智能体与设备系统融合的落地思路。依托工业计算机与边缘计算硬件积累,研扬科技已深度集成文心大模型、PaddleOCR等能力,并面向通用办公、特种涉密等不同场景推出风冷、液冷等多形态 AI 工作站,为 OpenClaw 本地运行、模型推理与业务调度提供工业级算力底座。对于大量企业客户而言,工业级硬件平台的稳定性、兼容性与可部署性,决定了 Agent 能否真正从 Demo 走向现场。

深圳铂盛科技与算力魔方品牌创始人刘力老师从算力基础设施与开发者生态视角,探讨了 Agent 应用背后的算力供给与工程支撑。无论是文档解析、视觉感知,还是多步骤任务执行,Agent 都需要更灵活的算力资源和更低门槛的部署环境。依托百度飞桨 PaddleOCR 版面解析 与 OceanBase 多模向量检索能力,企业可快速完成存量文档的结构化与向量化处理,并结合 ClawMaster 简化 OpenClaw 部署、模型配置、用量观测与记忆存储流程,降低中小企业智能体应用门槛。

DEEPX 高级工程师周家杰老师围绕 AI 芯片与模型适配,分享了端侧 AI 加速能力在智能体场景中的应用潜力。面向 OCR、视觉理解、边缘推理等任务,结合 PaddleOCR 、OceanBase 等技术,专用 AI 芯片能够在低功耗、低延迟环境下提供更高效的推理支持,也为 OpenClaw 这类需要多模态感知与持续执行的智能体系统提供了更扎实的硬件底座。

生产级 Agent 的落地关键不只是模型或框架,而是模型、数据、工具、算力、芯片、终端与场景之间的系统协同。与智能硬件伙伴的联合探索,也正在推动百度文心飞桨、OceanBase 多模数据底座等领先技术从软件工作流进一步延伸到端侧设备和真实生产环境中。

图片

Workshop 实操

从“看见能力”走向“亲手搭建”

在实操环节,LangChain & OceanBase Ambassador 张海立老师带来了「使用 ClawMaster 驾驭你的龙虾」Workshop,带领现场开发者完成 OpenClaw 与 ClawMaster 的实操体验,详细介绍了文心飞桨相关能力如何接入智能体工作流,让开发者在动手过程中理解 Agent 如何调用工具、组织流程并完成任务。

从星河社区的文档资产化能力,到智能硬件伙伴的软硬协同探索,再到 ClawMaster Workshop 的实操闭环,本次活动呈现出一条清晰路径:Agent 正从碎片化应用走向生产级智能引擎,从单点能力展示走向软硬协同的系统落地。

•  ClawMaster 

 https://github.com/openmaster-ai/clawmaster

•  Workshop 

https://github.com/openmaster-ai/clawmaster-workshop

百度文心飞桨、星河社区将继续携手 OceanBase、LangChain 及更多生态伙伴,为开发者提供更易用的模型能力、更完整的工程入口与更开放的生态支持,共同推动 AI Agent 在更多真实场景中落地生长。

图片

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐