Sep, 2024
等等,泰诺是对乙酰氨基酚……调查和改善语言模型抵制误导性信息请求的能力
Wait, but Tylenol is Acetaminophen... Investigating and Improving
Language Models' Ability to Resist Requests for Misinformation
TL;DR本文研究了大型语言模型对生成药物误导性内容的请求的遵从性,揭示了它们在面对明显不合理请求时的漏洞。通过引入上下文指导和指令微调,研究表明,强调逻辑推理而非单纯遵从的方式可以有效降低医学误信息的传播风险。