摘要
由于现实世界查询流具有动态演化特性,相关性模型难以泛化到实际搜索场景。现有自演化方法在大规模工业环境中面临两大挑战:(1)信息量丰富的样本稀疏且难以识别;(2)当前模型生成的伪标签不可靠。为此,本文提出自演化相关性模型(SERM),包含两个互补的多智能体模块:多智能体样本挖掘器用于检测分布偏移并识别信息量大的训练样本,多智能体相关性标注器通过两级共识机制提供可靠标签。在日均处理数十亿用户请求的大规模工业系统中评估表明,SERM通过迭代自演化显著提升性能,经多语言离线评估与在线测试验证有效。
AI 推荐理由
涉及多智能体协作中的信息筛选与标注,隐含记忆机制但未显式研究记忆架构。
论文信息