agent planning long-horizon autonomy adaptive agent profiles artificial society simulation
摘要

AIvilization v0 是一个公开部署的大规模人工社会系统,结合了资源受限的沙盒经济与统一的LLM-智能体架构,旨在实现长期自主性并适应快速变化的环境。为缓解目标稳定性与反应正确性之间的矛盾,本文引入了三项关键技术:(i) 分层分支思考规划器,将生活目标分解为并行目标分支,并通过模拟引导验证和分级重规划确保可行性;(ii) 具有双过程记忆的自适应智能体配置,分离短期执行轨迹与长期语义整合,实现持久而演化的身份;(iii) 人机协同控制接口,在适当抽象层次注入长期目标和短指令,通过记忆传播而非脆弱的提示覆盖实现影响传递。该环境集成了生理生存成本、不可替代的多级生产体系、基于AMM的价格机制以及门控教育-职业系统。利用平台成熟阶段的高频交易数据,发现稳定的市场能够再现关键特征事实(重尾收益和波动聚集),并产生由教育和访问限制驱动的结构化财富分层。实验表明,简化规划器在窄任务中可匹配性能,而完整架构在多目标、长期设置下更具鲁棒性,支持延迟投资和持续探索。

AI 推荐理由

论文重点介绍了用于长期目标分解和适应性规划的分层分支思考规划器,是规划能力的核心研究。

论文信息
作者 Wenkai Fan, Shurui Zhang, Xiaolong Wang, Haowei Yang, Tsz Wai Chan et al.
发布日期 2026-02-11
arXiv ID 2602.10429
相关性评分 9/10 (高度相关)