摘要
从调查和其他集体评估中获取信息以减少对潜在群体属性的不确定性,需要在真实成本和数据缺失的情况下合理分配有限的提问资源。尽管大语言模型支持自然语言中的自适应多轮交互,但现有方法通常固定受访人群,无法根据部分或缺失的回答进行调整。为此,本文研究了自适应群体信息获取问题,在明确的查询和参与预算下,代理自适应地选择问题和受访者。我们提出了一种理论支撑的框架,结合基于LLM的预期信息增益目标来评分候选问题,并利用异构图神经网络传播技术聚合观察到的回答和参与者属性,以填补缺失回答并指导每轮受访者的选取。该闭环过程在小规模、信息量大的个体样本上进行查询,同时通过结构化相似性推断群体层面的回答。在三个真实世界意见数据集上的实验表明,我们的方法在受限预算下显著提升了群体层面的回答预测效果,包括在10%受访者预算下CES指标相对提升超过12%。
AI 推荐理由
论文研究了在有限预算下如何通过多轮交互选择问题和受访者,属于任务规划与资源分配的核心内容。
论文信息