BriefGPT.xyz
大模型
Ask
alpha
关键词
honesty
搜索结果 - 3
BeHonest:大型语言模型诚实度基准测试
这篇论文介绍了一个名为 BeHonest 的新基准,旨在全面评估大型语言模型(LLMs)的诚实性,并强调了 LLMs 诚实性对现实世界的影响和迫切需要可靠方法和基准来确保和评估 LLMs 的诚实性。
PDF
15 days ago
两全其美:迈向一个真实和有用的大型语言模型
这篇论文介绍了如何通过确保大语言模型的诚实和帮助性来优化其在实际应用中的表现,包括建立诚实的准则、引入数据集进行评估和提出两种增强诚实和帮助性的方法。实验证明,这些增强方法可以显著提升大语言模型的诚实性和帮助性,有望为开发更可靠的实际应用语
→
PDF
a month ago
诚实对齐
应用对齐技术以增强大型语言模型(LLMs)的有益性和无害性,保证其在人类意图下主动拒绝回答缺乏知识的问题时不会过于保守是至关重要的。本文通过建立明确的问题定义,以及定义了《论语》所启发的 “诚实” 的基石,解决了识别 LLM 知识限度的挑战
→
PDF
7 months ago
Prev
Next