序列推荐 内存压缩
摘要

随着模型规模和数据量的增长,推荐系统面临高昂的计算开销,尤其在处理用户长行为序列时。现有方法常通过预存用户历史中间状态以避免重复计算,但忽视了由此带来的巨大内存开销。本文提出MALLOC,一个面向内存感知长序列压缩的综合基准,系统性地分类并评估适用于大规模序列推荐的内存管理技术。这些技术被集成至前沿推荐模型中,构建了一个可复现、易访问的评估平台。通过在准确性、效率与复杂度上的广泛实验,验证了MALLOC在推动大规模推荐系统发展中的整体可靠性。

AI 推荐理由

聚焦推荐系统中的长序列内存压缩,属Memory关键应用但非Agent核心架构。

论文信息
作者 Qihang Yu, Kairui Fu, Zhaocheng Du, Yuxuan Si, Kaiyuan Li et al.
发布日期 2026-01-28
arXiv ID 2601.20234
相关性评分 8/10 (高度相关)