摘要
多跳问答(QA)需要跨多个相互关联的主题、属性和关系进行多步骤推理和检索。现有的检索增强生成(RAG)方法难以准确捕捉这些结构化语义,导致性能不佳。基于图的RAG方法虽然将信息结构化为图,但生成的图通常存在噪声且计算成本高。此外,大多数方法依赖单步检索,忽略了多跳推理过程的需求。近期基于训练的方法尝试激励大语言模型(LLMs)进行迭代推理和检索,但其训练过程易出现不稳定收敛和高计算开销。为解决这些问题,我们设计了一个基于本体的立方体结构,具有多个正交维度,用于建模结构化主题、属性和关系。基于该立方体结构,我们提出了MultiCube-RAG,一种无需训练的方法,包含多个立方体以实现多步骤推理和检索。每个立方体专门用于建模某一类主题,使MultiCube-RAG能够灵活选择最合适的立方体以精确获取相关知识。为增强基于查询的推理和检索,我们的方法沿立方体维度将复杂的多跳查询分解为一系列简单的子查询,并依次解决它们。在四个多跳QA数据集上的实验表明,MultiCube-RAG相比多种基线方法平均提升了8.9%的响应准确性。值得注意的是,我们的方法还表现出更高的效率和内在可解释性。
AI 推荐理由
论文聚焦于多跳问答中的推理与检索机制,提出MultiCube-RAG以提升结构化语义建模和多步推理能力。
论文信息