Oct, 2020

开放式聊天机器人的安全配方

TL;DR探讨了在开放领域生成式对话模型中缓解无意识偏见、有害行为的问题,提出了新的人与模型交互框架及新方法,而不使用外部分类器,在保证模型可用性的同时更安全,实现了自动和人为评估。