摘要
学习内部推理过程对于开发能够在动态现实环境中持续适应的AI系统至关重要。然而,现有方法大多强调任务特定输出或静态知识表示的学习,忽视了内部推理结构、行动调度策略和学习机制本身的持续优化。本文提出了一种受人类启发的连续学习框架,通过并行学习增强的顺序推理模型,统一了推理、行动、反思和验证。该框架将内部思维过程作为主要学习对象,系统记录内部推理轨迹和环境交互作为结构化学习材料,使系统不仅优化任务级内容,还优化推理活动的组织、调度和演化。该设计实现了处理与学习同步进行,使认知结构在执行过程中得到提升。此外,框架支持预定义逻辑的可控替换,并引入了联合适应任务级参数和学习策略的分层学习机制。实验结果表明,在温度传感器异常检测任务中,结合内部过程学习可使平均运行时间减少23.9%。
AI 推荐理由
论文核心聚焦于内部推理过程的持续学习,直接涉及推理机制的优化与进化。
论文信息