BriefGPT.xyz
大模型
Ask
alpha
关键词
harmful text
搜索结果 - 3
有害文本的特征:走向对语言模型严格基准测试
大型语言模型生成的文本在越来越多的应用程序中表现得像人类一样,但是最近的文献和实际观察表明,这些模型可以生成有毒,偏见,不真实或有害的语言。本文提出了六种方式来表征有害文本,并应用于现有基准和案例研究,为有害文本的评估提供了有效的方法。
PDF
2 years ago
EMNLP
自然语言处理研究中有害文本的处理和展现
本文介绍了一个将 NLP 中的文本有害信息分为三个轴的分析框架,提供了处理和呈现有害文本的建议,并引入了使用文档标准来处理和呈现有害文本的方法。
PDF
2 years ago
使用条件似然过滤减少语言模型的危害
提出一种从网页规模数据集中识别和过滤有害文本的方法,使用预训练语言模型计算特定文档条件下研究员编写的触发词组的对数似然,并根据该结果识别和过滤数据集中的文档,证明在过滤后的数据集上训练的语言模型产生有害文本的倾向更低,性能与未过滤基线相比略
→
PDF
3 years ago
Prev
Next