Dec, 2023

通过引导和精简大型语言模型实现高效毒性内容检测

TL;DRBD-LLM 提出了一种新颖而高效的方法,利用 Bootstrapping 和 Distilling 技术提取高质量的 rationales,用于毒性内容检测,并可提高 Large Language Models 的准确性和跨数据集的可迁移性。