BriefGPT.xyz
Ask
alpha
关键词
ambiguous scenarios
搜索结果 - 3
房子永远赢:评估 LLMs 中战略欺骗的框架
我们提出了一个用于评估大型语言模型(LLMs)中策略性欺骗的框架。在这个框架中,LLM 作为一个游戏大师在两个场景中表现:一个场景中具有随机游戏机制,另一个场景中可以选择随机或故意的行动。我们以二十一点作为示例,因为其行动空间和策略不涉及欺
→
PDF
5 days ago
ChatGPT 与 Gemini 与 LLaMA 在多语言情感分析中的比较
使用大型语言模型(LLM)的自动情感分析在学术研究和工业应用中越来越普遍,但在处理模糊或讽刺文本的性能评估和验证方面仍不够完善。本研究构建了细致和模糊的场景,将其翻译成 10 种语言,并使用流行的 LLM 预测其关联的情感。结果经过后续人为
→
PDF
5 months ago
评估 LLM 中所包含的道德信念
本论文通过大规模语言模型的调查研究案例来介绍了一种用于获取编码在语言模型中的信念的统计方法,并应用此方法研究了不同语言模型中编码的道德信念,特别是在选择不明显的模棱两可情况下。这项研究设计了一项大规模调查研究,包含了 680 个道德情景(如
→
PDF
a year ago
Prev
Next