Aug, 2024

构建心理健康聊天机器人的信任:安全性指标和基于大型语言模型的评估工具

TL;DR本研究解决了心理健康聊天机器人的安全性和可靠性评估的不足,提出了一种包含100个基准问题和理想回应的评估框架,并通过心理健康专家的验证。研究显示,采用实时数据访问的代理方法在评估准确性上优于其他方法,为心理健康聊天机器人的安全性和可靠性提供了显著提升的方案。