BriefGPT.xyz
大模型
Ask
alpha
关键词
corrective feedback
搜索结果 - 4
ACL
年轻英语学习者语音的错误保留自动语音识别
在这项工作中,我们构建了一个满足条件的自动语音识别系统,用于年轻语言学习者的自由说话并保留他们的错误。
PDF
a month ago
从零开始照看语言模型:通过试验和演示进行交互式语言学习
通过系统性可控实验,我们研究了互动交互对神经语言学习的影响,发现通过教师示范和学生尝试,互动式语言学习有助于语言模型的词汇学习效率提高。
PDF
a month ago
利用预训练的大型语言模型构建和利用世界模型进行基于模型的任务规划
本研究引入了一种新的方法,使用 PDDL 语言构建显式世界模型,并利用预训练的大型语言模型作为 PDDL 和校验器等纠正反馈的接口,以提高计划问题的效率和准确性。在不涉及用户互动的情况下,通过验证 PDDL 模型的正确性,我们制定计划来解决
→
PDF
a year ago
DisCor: 基于分布校正的强化学习纠错反馈
探讨了深度强化学习中 Q-learning 等方法实现不稳定、难以调参的问题,提出了一种基于数据分布优化的新算法,DisCor,通过纠正数据分布来改善学习效果。
PDF
4 years ago
Prev
Next