May, 2024

SLM 作为守护者:先驱性地利用小型语言模型进行人工智能安全

TL;DR利用较小的大语言模型实现有害查询检测和安全响应,通过多任务学习机制融合两个任务到一个模型里,效果在公开的大语言模型上表现相当或超过有害查询检测和安全响应的性能。