空间推理 强化学习 布局设计 可解释性 LLM优化
摘要

本文提出LaySPA,一种强化学习框架,使大型语言模型(LLMs)具备显式且可解释的空间推理能力,用于内容感知的图形布局设计。LaySPA解决了两个关键挑战:LLMs有限的空间推理能力和设计决策过程的不透明性。通过将布局设计重新表述为结构化文本空间环境中的策略学习问题,LaySPA生成包含可解释推理轨迹和结构化布局规范的双重输出,从而实现透明可控的设计决策。布局设计策略通过多目标空间批评进行优化,将布局质量分解为几何有效性、关系一致性和美学一致性,并使用相对组优化方法训练,以稳定开放设计空间中的学习。实验表明,LaySPA在结构有效性和视觉质量方面优于更大的专有LLMs,并达到与最先进的专用布局生成器相当的性能,同时需要更少的标注样本和更低的延迟。

AI 推荐理由

论文聚焦于增强LLM的空间推理能力,属于推理能力的核心研究。

论文信息
作者 Sha Li, Stefano Petrangeli, Yu Shen, Xiang Chen
发布日期 2026-02-14
arXiv ID 2602.13912
相关性评分 9/10 (高度相关)