BriefGPT.xyz
Ask
alpha
关键词
state-of-the-art large language models
搜索结果 - 2
连接点:使用纽约时报连线游戏评估 LLMs 的抽象推理能力
《纽约时报连线游戏对大型语言模型的性能评估》揭示了大型语言模型在解决连线游戏时的局限性,同时发现专家玩家在这方面表现更好,为人工智能系统的抽象推理能力提供了具有挑战性的评估基准。
PDF
20 days ago
强化学习从人类反馈中的开放问题与基本限制
强化学习来自人类反馈是一种训练 AI 系统与人类目标对齐的技术,但其自身存在的问题、局限性以及相关改进技术的概述,以及提出用于改善社会监督的审计和公开标准的重要性。
PDF
a year ago
Prev
Next