BriefGPT.xyz
大模型
Ask
alpha
关键词
sensitivity policies
搜索结果 - 1
欺骗以启蒙:诱导 LLMs 自省以增强偏见检测和缓解
大型语言模型(LLMs)嵌入了复杂的偏见和刻板印象,可能导致有害的用户体验和社会后果,而模型本身通常没有意识到这一点。本文强调了为 LLMs 配备更好的自我反思和偏见识别机制的重要性。我们的实验表明,通过告知 LLMs 它们生成的内容不代表
→
PDF
3 months ago
Prev
Next