BriefGPT.xyz
大模型
Ask
alpha
关键词
decision-making capabilities
搜索结果 - 3
ICLR
HAZARD 挑战:动态环境下的体验决策制定
利用高保真虚拟环境的最新进展来建立智能化的具有知觉、推理和与物理世界交互能力的实体代理是推动力之一。我们提出了一种名为 HAZARD 的新的模拟实体评估标准,旨在评估动态情况下实体代理的决策能力。HAZARD 包括火灾、洪水和风等三个突发灾
→
PDF
5 months ago
O3D:用于大型语言模型的离线数据驱动发现与蒸馏的顺序决策制定
我们提出了一种离线学习框架,利用大规模的离线数据(如人类互动日志)来改善大型语言模型的在上下文学习性能。我们通过文本和代码的方法形式化定义了基于大型语言模型的策略,并引入了一种离线数据驱动的发现和精炼框架(O3D),以改善大型语言模型的决策
→
PDF
8 months ago
LLM-Deliberation:用互动多智能体协商游戏评估 LLMs
使用可评分的协商游戏作为新的评估框架,系统化的零样本链式思考提示能够展示大型语言模型在协商中的能力和绩效差距。
PDF
9 months ago
Prev
Next