BriefGPT.xyz
Nov, 2023
生活毒性:揭示生活建议中的隐含毒素
LifeTox: Unveiling Implicit Toxicity in Life Advice
HTML
PDF
Minbeom Kim, Jahyun Koo, Hwanhee Lee, Joonsuk Park, Hwaran Lee...
TL;DR
利用设计的 LifeTox 数据集,通过在广泛的寻求建议的情境中识别隐含的有害性,实验证明,在隐含有害性分类任务中,RoBERTa 在 LifeTox 上的微调结果可以与大型语言模型的零样本性能相匹配或超过,进一步强调了 LifeTox 在应对隐含有害性的复杂挑战方面的功效。
Abstract
As
large language models
become increasingly integrated into daily life, detecting
implicit toxicity
across diverse contexts is crucial. To this end, we introduce LifeTox, a dataset designed for identifying
→