BriefGPT.xyz
大模型
Ask
alpha
关键词
negotiation games
搜索结果 - 2
评估语言模型代理的方法与谈判
通过协商游戏来共同评估语言模型的性能和对齐情况,发现开源模型目前无法完成这些任务,合作协商游戏具有挑战性,最强大的模型并非总是 “赢家”。
PDF
6 months ago
LLM-Deliberation:用互动多智能体协商游戏评估 LLMs
使用可评分的协商游戏作为新的评估框架,系统化的零样本链式思考提示能够展示大型语言模型在协商中的能力和绩效差距。
PDF
9 months ago
Prev
Next