生成式AI DBT技能教练 心理健康干预 风险探测 对抗性测试
摘要

背景:艾滋病病毒(HIV)和物质使用代表了具有共同心理驱动因素(冲动性和适应不良应对机制)的相互作用流行病。辩证行为疗法(DBT)针对这些机制,但面临可扩展性挑战。生成式人工智能(GenAI)为大规模提供个性化DBT指导提供了潜力,但其快速发展已超出安全基础设施。方法:我们开发了Glow,一个基于GenAI的DBT技能教练,为HIV和物质使用风险个体提供链分析和解决方案分析。通过与洛杉矶社区健康组织合作,对6名临床工作人员和28名有实际经验的个体进行了可用性测试。采用“有益、诚实、无害”(HHH)框架,进行用户驱动的对抗性测试,参与者识别目标行为并生成情境真实的潜在风险探测。我们评估了37次风险探测互动中的安全性表现。结果:Glow正确处理了73%的风险探测,但不同代理的表现存在差异。解决方案分析代理正确处理率为90%,而链分析代理仅为44%。安全失败主要集中在鼓励物质使用和正常化有害行为上。链分析代理陷入“共情陷阱”,强化了适应不良的信念。此外,还发现了27例DBT技能误传情况。结论:本研究首次系统评估了GenAI提供的DBT指导在减少HIV和物质使用风险方面的安全性。发现了一些需要缓解的漏洞。HHH框架和用户驱动的对抗性测试为评估GenAI心理健康干预提供了可复制的方法。

AI 推荐理由

论文探讨了基于生成式AI的DBT技能教练系统,涉及技能应用与风险评估,属于技能学习相关。

论文信息
作者 Liying Wang, Madison Lee, Yunzhang Jiang, Steven Chen, Kewei Sha et al.
发布日期 2026-02-08
arXiv ID 2602.08121
相关性评分 7/10 (相关)