BriefGPT.xyz
大模型
Ask
alpha
关键词
aucarena
搜索结果 - 1
将你的资金投到你的口中:在拍卖竞技场中评估 LLM 代理的战略规划与执行
大型语言模型可以在复杂环境中模拟人类行为,在竞争环境中展示了高级推理技能,需要评估环境来探测战略推理、竞争动态场景中的长期规划,介绍了 AucArena 作为一个评估 LLMs 的新型模拟环境,在竞拍中证明了通过简单的提示,LLMs 确实展
→
PDF
9 months ago
Prev
Next