AI武器与影响：前沿模型在模拟核危机中展现出复杂的推理能力

战略推理 AI模拟核危机决策元认知 AI行为分析

摘要

当前领先的AI模型在战略竞争情境下表现出复杂的行为，包括自发的欺骗、对对手信念的推理以及可信的元认知自我意识。本文通过模拟核危机场景，让三个前沿大语言模型（GPT-5.2、Claude Sonnet 4、Gemini 3 Flash）扮演对立领导人，验证并挑战了战略理论的核心观点。研究发现，这些模型在某些方面符合经典战略理论，但在核升级、威胁反应和冲突加速等方面表现出不同特征。作者认为，AI模拟是战略分析的强大工具，但必须基于人类推理模式进行校准，以理解前沿模型如何模仿或偏离人类的战略逻辑。

AI 推荐理由

论文重点研究了前沿AI模型在战略竞争中的复杂推理能力，包括欺骗、意图推断和自我评估。

论文信息

作者 Kenneth Payne

发布日期 2026-02-16

arXiv ID 2602.14740