摘要
知识密集型视觉问答(KI-VQA)常因开放域检索的固有限制而面临严重的知识冲突问题。现有方法由于缺乏通用的冲突检测和模型内约束机制而存在关键局限。为应对这些挑战,本文提出基于新型‘推理-关键点’概念的REAL框架。该框架将推理-关键点作为推理链中的原子单元,强调知识链接,并依赖外部证据完成推理。通过构建的REAL-VQA数据集,该方法结合了推理-关键点感知的监督微调(RPA-SFT)以训练可泛化的判别器,并采用推理-关键点引导解码(RPGD)策略进行针对性冲突缓解。大量实验表明,REAL显著提升了判别准确率,达到了最先进的性能,验证了其以关键点驱动的解决范式的有效性。
AI 推荐理由
论文聚焦于通过推理链中的关键节点(Reasoning-Pivot)解决知识冲突,直接涉及推理机制与逻辑处理。
论文信息