Feb, 2023

内部 - 外显任务语言发展与翻译驱动的自然语言指导下的强化学习

TL;DR采用内部 - 外部模式的自然语言控制强化学习方法使用任务语言与谓词表示来学习多个断言以模拟对象关系,并将翻译器用于自然语言到任务语言的转换,有效地提高 13.4% 的成功率和适应性,并成为有效的任务抽象形式,与层次强化学习相容。