摘要
本文提出LaySPA,一种强化学习框架,使大型语言模型(LLMs)具备显式且可解释的空间推理能力,用于内容感知的图形布局设计。LaySPA解决了两个关键挑战:LLMs有限的空间推理能力和设计决策过程的不透明性。通过将布局设计重新表述为结构化文本空间环境中的策略学习问题,LaySPA生成包含可解释推理轨迹和结构化布局规范的双重输出,从而实现透明可控的设计决策。布局设计策略通过多目标空间批评进行优化,将布局质量分解为几何有效性、关系一致性和美学一致性,并使用相对组优化方法训练,以稳定开放设计空间中的学习。实验表明,LaySPA在结构有效性和视觉质量方面优于更大的专有LLMs,并达到与最先进的专用布局生成器相当的性能,同时需要更少的标注样本和更低的延迟。
AI 推荐理由
论文聚焦于增强LLM的空间推理能力,属于推理能力的核心研究。
论文信息