摘要
为处理模糊和开放式的请求,大型语言模型(LLMs)正被越来越多地训练以与用户互动,从而揭示用户尚未表达的意图(例如,提出澄清问题)。然而,用户往往由于尚未形成明确意图而表现出模糊性,他们必须通过观察和探索结果来发现自己的需求。简单地询问“你想要什么样的语气?”在用户自身也不清楚时会失效。我们引入了DiscoverLLM,这是一种新颖且通用的框架,用于训练LLMs帮助用户形成并发现其意图。我们的方法核心是一个新的用户模拟器,该模拟器通过一个分层的意图体系建模认知状态,并随着模型呈现相关选项逐步具体化——其中具体化的程度作为模型优化的奖励信号。由此得到的模型能够通过适应性发散(即探索选项)在意图不明确时协作,而在意图具体化时收敛(即精炼和实施)。在创意写作、技术写作和SVG绘图等提出的交互式基准测试中,DiscoverLLM实现了超过10%的任务性能提升,同时将对话长度减少了高达40%。在一项包含75名参与者的用户研究中,DiscoverLLM相比基线方法显著提高了对话满意度和效率。
AI 推荐理由
论文涉及用户意图发现与LLM交互,隐含记忆机制但非核心主题。
论文信息