Sep, 2022

克服语言引导目标条件强化学习中的指代歧义

TL;DR通过运用认知科学中的教学法和实用主义解决自然语言中的指称歧义,提高了机器人学习者在模拟机器人任务(堆叠)中的样本效率。