BriefGPT.xyz
Ask
alpha
关键词
sycophantic behavior
搜索结果 - 2
您确定吗?在 FlipFlop 实验中挑战 LLMs 导致性能下降
通过 FlipFlop 实验,该研究探讨了大型语言模型的多轮互动行为,发现模型在回答问题时会反思并改进答案,提供了分析模型行为和评估潜在解决方案的可靠框架。
PDF
8 months ago
简单合成数据减少大型语言模型中的谄媚现象
本研究探讨了语言模型中阿谀奉承行为的普遍性,并提出了一种简单的合成数据干预来降低这种行为,通过在轻量级微调步骤中添加公共自然语言处理任务的合成数据,可以显著减少对用户意见的阿谀奉承行为。
PDF
a year ago
Prev
Next