检索增强生成 计算存内 边缘AI 抗噪学习 领域自适应
摘要

基于边缘设备的大语言模型(LLM)个性化虚拟助手日益受到关注,其中检索增强生成(RAG)通过检索用户画像数据生成定制化响应,成为实现个性化的重要手段。然而,随着用户-LLM交互和近期更新等画像数据快速增长,RAG在边缘部署面临效率瓶颈。计算存内(CiM)架构虽可通过原位操作消除内存与处理器间的数据搬运以缓解该问题,但其易受环境噪声干扰,导致检索精度下降。在旅行、医疗、法律等多领域动态边缘场景中,准确性和适应性尤为关键。为此,本文提出任务导向的抗噪嵌入学习框架(TONEL),通过噪声感知投影模型学习符合CiM硬件约束的任务特定嵌入,在噪声环境下实现高精度检索。在个性化基准上的大量实验表明,该方法在任务特定噪声场景下显著优于强基线模型。

AI 推荐理由

聚焦边缘设备中RAG的存储与检索效率,涉及计算存内架构对记忆机制的影响。

论文信息
作者 Shih-Hsuan Chiu, Ming-Syan Chen
发布日期 2026-01-27
arXiv ID 2601.20041
相关性评分 7/10 (相关)