Sep, 2023

通过知识蒸馏促进开放域对话系统中NSFW文本的检测

TL;DR研究聚焦于NSFW内容检测在开放域对话系统中带来的副作用,介绍了一个对话监控数据集CensorChat,利用GPT-4和ChatGPT进行知识蒸馏,开发了一种成本效益高的NSFW内容检测方法,强调了在数字对话中AI系统优先考虑用户安全和福祉,同时尊重言论自由。