world modeling neuro-symbolic reasoning llm symbolic reasoning
摘要

大型语言模型(LLMs)展现出强大的通用推理能力,但在作为世界模型(WMs)使用时,常常会产生幻觉,尤其是在需要严格遵循确定性转换规则的边缘情况下。相比之下,符号世界模型虽然具有逻辑一致性,但缺乏语义表达能力。为弥合这一差距,本文提出了一种名为Neuro-Symbolic Synergy(NeSyS)的框架,该框架将LLMs的概率语义先验与可执行的符号规则相结合,以实现表达能力和鲁棒性的统一。NeSyS通过交替训练两个模型,并利用对方无法充分解释的轨迹进行优化。与基于规则的提示方法不同,符号世界模型直接通过修改LLM的输出概率分布来约束其行为。神经世界模型仅在未被符号规则覆盖的轨迹上进行微调,从而减少了50%的训练数据,同时保持了准确性。在ScienceWorld、Webshop和Plancraft三个不同的交互环境中进行的大量实验表明,NeSyS在世界模型预测准确性和数据效率方面均优于基线方法。

AI 推荐理由

论文聚焦于LLM的推理能力与世界模型的结合,强调逻辑一致性与语义表达的融合。

论文信息
作者 Hongyu Zhao, Siyu Zhou, Haolin Yang, Zengyi Qin, Tianyi Zhou
发布日期 2026-02-11
arXiv ID 2602.10480
相关性评分 9/10 (高度相关)