物理模拟 多代理系统 视觉语言模型 代码生成 自反思机制
摘要

本文提出了一种多代理框架,用于从自然语言描述中生成物理模拟代码,并引入了一种新颖的感知自反思机制进行验证。系统包含四个专业代理:自然语言解释器、技术需求生成器、物理代码生成器和物理验证器。关键创新在于感知验证,通过视觉语言模型分析渲染动画帧,而非直接检查代码结构,从而解决传统测试无法检测的语法正确但物理行为错误的问题。实验覆盖七个领域,结果显示该架构在多数场景中显著优于单次生成基线,具有稳定的流水线能力和较低的成本。结果验证了将视觉模拟输出反馈给视觉语言模型进行迭代优化在物理模拟任务中的优越性,并突显了代理AI在工程工作流和物理数据生成中的潜力。

AI 推荐理由

论文提出感知自反思机制,用于验证物理模拟代码的准确性,涉及推理与逻辑验证。

论文信息
作者 Prashant Shende, Bradley Camburn
发布日期 2026-02-12
arXiv ID 2602.12311
相关性评分 9/10 (高度相关)