BriefGPT.xyz
Ask
alpha
关键词
llm-generated texts
搜索结果 - 3
白人男性主导,黑人女性协助:揭示语言代理中的性别、种族和交叉偏见
通过语言表达的机构性来研究社会偏见,探究人类编写文本和大型语言模型(LLM)生成文本中的社会偏见,并通过验证数据集和分类器揭示不同领域的语言机构性偏见。研究结果表明,在性别、种族和交叉身份方面,人类编写的文本中存在与现实社会观察一致的语言机
→
PDF
3 months ago
水印技术使语言模型放射性增强
调查了 LLM 生成的文本的辐射性,即是否可能检测到这种输入被用作训练数据;与成员推断等传统方法相比,我们发现水印训练数据留下的痕迹更容易检测且更可靠;我们将污染程度与水印的鲁棒性、在训练集中所占比例和微调过程联系起来;我们特别证明,即使仅
→
PDF
4 months ago
OUTFOX:基于情境学习和对抗生成示例的 LLM 生成式文章检测
提出 OUTFOX 框架,通过允许检测器和攻击者考虑彼此的输出来提高 LLM 生成文本检测器的鲁棒性,并将其应用于学生作文领域。
PDF
a year ago
Prev
Next