BriefGPT.xyz
Ask
alpha
关键词
general-purpose skills
搜索结果 - 1
关于基于语言条件技能发现的互信息思考与模仿学习
通过数学方法评估语言条件化策略学习框架中技能与语言指令之间的关系,提出了一种称为语言条件化技能发现(LCSD)的端到端模仿学习方法,通过最大化语言和技能之间的互信息,在无监督的情况下学习离散潜在技能并利用技能序列重构高级语义指令,通过在 B
→
PDF
4 months ago
Prev
Next