位置：从对话环境中获得的内省经验作为更好学习的路径

自我反思对话学习推理能力社会互动认知发展

摘要

当前AI训练方法将推理视为规模扩展的副产品。本文认为，稳健的推理能力源于语言自我反思，而这种反思是从高质量的社会互动中内化的。基于维果茨基的发展心理学理论，文章提出三个核心观点：首先，私人思维的社会起源表明，从对话环境中学习成为理解世界的新方式；其次，通过对话构建的内省体验使代理能够脱离即时数据流进行学习，将原始环境数据转化为可学习的丰富叙事；最后，对话质量是新的数据质量，代理的私密推理深度和测试时计算效率取决于其掌握的对话多样性与严谨性。结论指出，优化这些对话框架是下一代通用智能的关键杠杆。

AI 推荐理由

论文聚焦于通过对话环境中的自我反思提升推理能力，直接涉及推理机制的生成与优化。

论文信息

作者 Claudiu Cristian Musat, Jackson Tolins, Diego Antognini, Jingling Li, Martin Klissarov et al.

发布日期 2026-02-16

arXiv ID 2602.14910