Agent Memory Preference Propagation
摘要

智能体推荐系统利用大语言模型(LLMs)建模复杂用户行为并支持个性化决策。然而,现有方法主要依赖稀疏、噪声大的显式用户-物品交互数据,难以捕捉用户与物品间的实时相互影响。为此,本文提出RecNet——一种自演化的偏好传播框架,主动在相关用户与物品间传播实时偏好更新。RecNet包含两个互补阶段:前向阶段通过中心化偏好路由机制,利用路由智能体整合并动态传播偏好至最相关智能体,并引入个性化偏好接收机制,结合消息缓冲区与可优化的规则记忆模块,基于过往经验与兴趣选择性吸收偏好;后向阶段则采用反馈驱动的传播优化机制,模拟多智能体强化学习框架,利用LLM进行信用分配、梯度分析与模块级优化,实现传播策略的持续自演化。大量实验验证了RecNet在建模推荐系统偏好传播中的有效性。

AI 推荐理由

提出基于记忆机制的偏好传播框架,核心包含可优化的规则记忆模块。

论文信息
作者 Bingqian Li, Xiaolei Wang, Junyi Li, Weitao Li, Long Zhang et al.
发布日期 2026-01-29
arXiv ID 2601.21609
相关性评分 8/10 (高度相关)