超维方程在做科研和工程场景里的 AI Agent 系统时,遇到过一个很具体的问题:大模型生成工程脚本并不难,难的是让脚本在真实求解器里稳定运行。以 MAPDL 有限元仿真为例,脚本语法正确并不代表任务完成:网格、单元类型、求解收敛和后处理都可能在执行阶段失败。

这篇文章结合超维方程团队参与的 CAX-Agent 论文,整理一种轻量级 Agent Harness 的设计思路:把大模型的脚本生成能力和工程软件的真实执行反馈连接起来,让系统具备可监控、可恢复、可人工接管的闭环。

一、问题:脚本生成不等于仿真完成

在工程仿真任务中,LLM 生成 APDL 脚本后,常见失败并不一定来自语法错误,而是来自运行时环境和工程约束。

  • 网格划分失败,几何形状或网格尺寸不适合当前设置。
  • 求解器不收敛,需要调整载荷步、子步或求解参数。
  • 单元类型不兼容,例如实体单元、壳单元选择不合适。
  • 后处理结果缺失,结果文件、载荷步或输出变量不符合预期。

如果系统只是一次性生成脚本并提交执行,那么任意一个运行时错误都会中断整个流程。工程场景需要的是执行闭环,而不是单轮代码生成。

二、超维方程的三层 Harness 思路

CAX-Agent 将系统拆成三层,让每一层职责明确。

层级 职责
LLM 服务层 理解任务、生成 APDL 脚本、根据错误上下文修复脚本。
Agent Harness 层 管理工具生命周期、执行状态、重试预算、故障恢复和停止条件。
求解器后端层 调用 MAPDL 执行脚本,提取日志、结果文件和错误信息。

这里的关键原则是:不要让 LLM 直接控制执行循环。模型可以提出修复方案,但是否允许重试、最多重试几次、什么时候停止,应由 Harness 层统一管理。

三、故障恢复路径

一个可用的工程 Agent 需要有明确的恢复路径。CAX-Agent 论文中讨论了由低成本到高成本的递进策略。

  1. 确定性规则修补:针对明确错误做低成本修复,例如调整网格参数、替换单元类型或修正后处理命令。
  2. 模型驱动再生成:把错误日志注入上下文,让模型根据真实失败原因重新生成脚本。
  3. 上下文增强:补充几何、边界条件、材料参数或相似案例,帮助模型做更完整的修复。
  4. 人工介入:自动恢复无法继续时,输出可读的错误报告和执行轨迹,让研究人员接管。

四、实验结果

论文在 50 个标准结构基准任务上比较了不同恢复策略,任务覆盖梁、板、圆柱等静态、模态和热分析场景。实验结果显示,相比无恢复和仅规则恢复,基于错误日志的模型驱动恢复在完成率和自动化程度上表现更好。

论文全文:CAX-Agent: A Lightweight Agent Harness for Reliable APDL Automation

五、结论

超维方程关注的不是“让模型写一段看起来正确的脚本”,而是让 AI Agent 真正进入科研和工程工作流。对于 MAPDL、COMSOL、Abaqus 这类工程软件,Harness 层的设计、日志提取、重试预算和人工接管机制,往往比单次提示词更重要。

换句话说,可靠性不是靠一次更长的 prompt 解决的,而是靠系统架构解决的。

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐