摘要
通用持续学习(GCL)要求智能系统在无明确任务边界、单次遍历的非平稳数据流中持续学习。现有基于预训练模型的参数高效微调方法通常依赖多轮训练和显式任务提示,难以适用于GCL场景,且缺乏对专家参数分配与表征能力提升的针对性设计。受果蝇具有稀疏扩展与模块化集成特性的分层记忆系统启发,本文提出FlyPrompt框架,将GCL分解为专家路由与专家能力提升两个子问题,引入随机扩展的解析路由器实现样本级专家激活,并采用输出头的时间集成动态调整决策边界。实验表明,FlyPrompt在CIFAR-100、ImageNet-R和CUB-200上分别超越当前最优基线达11.23%、12.43%和7.62%。
AI 推荐理由
受果蝇分层记忆系统启发,提出专家路由与集成机制,涉及记忆结构但非LLM Agent核心记忆研究。
论文信息