BriefGPT.xyz
Ask
alpha
关键词
zero-shot imitation
搜索结果 - 2
通过最大化证据推断行动:从观察中无标签模仿的世界模型
通过最大化证据的行动推理(AIME)和世界模型,在不需要进一步训练或与环境在线交互的情况下,通过观察和模仿他人的行为实现零 - shot 模型的人工智能代理。
PDF
7 months ago
ICML
领域自适应模仿学习
介绍了一种领域自适应模仿学习(DAIL)问题的形式化表达,提出了一种两步方法:对齐和适应,通过无监督的 MDP 对齐算法(GAMA)执行对齐步骤并利用对应关系在不需要经过环境交互的情况下在不同领域中实现任务零次模仿。
PDF
5 years ago
Prev
Next