摘要
随着模型规模和数据量的增长,推荐系统面临高昂的计算开销,尤其在处理用户长行为序列时。现有方法常通过预存用户历史中间状态以避免重复计算,但忽视了由此带来的巨大内存开销。本文提出MALLOC,一个面向内存感知长序列压缩的综合基准,系统性地分类并评估适用于大规模序列推荐的内存管理技术。这些技术被集成至前沿推荐模型中,构建了一个可复现、易访问的评估平台。通过在准确性、效率与复杂度上的广泛实验,验证了MALLOC在推动大规模推荐系统发展中的整体可靠性。
AI 推荐理由
聚焦推荐系统中的长序列内存压缩,属Memory关键应用但非Agent核心架构。
论文信息