Jul, 2021

E2E 会话型 AI 安全问题预测:框架和工具

TL;DR本文讨论了在训练端到端对话 AI 模型时会遇到的关于安全性的困境。提供了一个基于价值观的设计框架,以帮助研究人员在决定何时和如何发布这些模型时做出更合理的决策,并提供了一套工具来帮助他们进行更明智的选择。