Jul, 2023

精神健康支持中对话安全的基准测试

TL;DR通过开发具有理论和事实基础的聚焦于帮助寻求者积极影响的分类法以及创建具有细粒度标签的基准语料库,本研究在心理健康支持对话中分析使用 BERT-base、RoBERTa-large 和 ChatGPT 等流行语言模型以检测和理解不安全回应,并揭示 ChatGPT 在零样本和少样本范式中无法检测具有详细定义的安全类别,而经过微调的模型更加适用,为心理健康支持对话的对话安全研究提供了有价值的基准,并对改善真实应用中对话代理的设计和部署产生了重大影响。