摘要
大语言模型(LLMs)已推动组合优化问题(COPs)中自动化启发式设计(AHD)的发展,但现有框架依赖固定进化规则和静态提示模板,易导致短视生成、冗余评估及推理能力不足。本文提出PathWise——一种多智能体推理框架,将启发式生成建模为在蕴含图上的序贯决策过程,该图作为紧凑且具状态性的记忆结构,记录搜索轨迹并支持跨代信息复用或规避。系统包含策略智能体规划进化动作、世界模型智能体生成条件启发式 rollout,以及批评家智能体提供路由反思以总结历史经验,从而将LLM驱动的AHD从试错式进化转向基于状态感知的规划推理。实验表明,PathWise在多种COP上更快收敛至更优启发式,兼容不同LLM主干,并可扩展至更大规模问题。
AI 推荐理由
提出基于蕴含图的状态化记忆机制,用于记录和复用搜索轨迹,是启发式生成的关键组件。
论文信息