从像素到策略：强化语言模型的空间推理能力以实现内容感知的布局设计

空间推理强化学习布局设计可解释性 LLM优化

摘要

本文提出LaySPA，一种强化学习框架，使大型语言模型（LLMs）具备显式且可解释的空间推理能力，用于内容感知的图形布局设计。LaySPA解决了两个关键挑战：LLMs有限的空间推理能力和设计决策过程的不透明性。通过将布局设计重新表述为结构化文本空间环境中的策略学习问题，LaySPA生成包含可解释推理轨迹和结构化布局规范的双重输出，从而实现透明可控的设计决策。布局设计策略通过多目标空间批评进行优化，将布局质量分解为几何有效性、关系一致性和美学一致性，并使用相对组优化方法训练，以稳定开放设计空间中的学习。实验表明，LaySPA在结构有效性和视觉质量方面优于更大的专有LLMs，并达到与最先进的专用布局生成器相当的性能，同时需要更少的标注样本和更低的延迟。

AI 推荐理由

论文聚焦于增强LLM的空间推理能力，属于推理能力的核心研究。

论文信息

作者 Sha Li, Stefano Petrangeli, Yu Shen, Xiang Chen

发布日期 2026-02-14

arXiv ID 2602.13912