摘要
心智理论(ToM)评估模型是否能够推断隐藏的心理状态,如信念、欲望和意图,这对自然社交互动至关重要。尽管大型推理模型(LRMs)在数学和编程中的逐步推理方面取得了进展,但其在社会认知技能中的迁移效果仍不明确。本文系统研究了九种先进的大型语言模型(LLMs),比较了推理模型与非推理模型在三个代表性ToM基准上的表现。结果表明,推理模型并不总是优于非推理模型,有时甚至表现更差。细致分析揭示了三个关键发现:首先,慢思考会导致准确率下降;其次,适度且自适应的推理有助于提升性能;第三,模型依赖选项匹配而非真正的推理。本文还设计了两种干预方法以验证并缓解这些问题。研究表明,LRMs在形式推理方面的进步无法完全迁移到ToM任务中,实现稳健的心智理论需要超越现有推理方法的独特能力。
AI 推荐理由
论文聚焦于推理模型在心智理论任务中的表现,探讨其推理机制与局限性,属于推理能力的核心研究。
论文信息