BriefGPT.xyz
Ask
alpha
关键词
observation data
搜索结果 - 4
ICLR
基于观察的模仿学习与自动折扣调度
通过自动折扣调度的机制适应性地改变强化学习的折扣系数,我们提出了一种新颖的观察学习框架,使得代理能够在掌握较早行为之后再逐步转向后续行为,并通过在九个 Meta-World 任务上的实验证明该方法在所有任务中明显优于现有方法。
PDF
9 months ago
冲突感知主动自动机学习
Conflicts in observation data pose a challenge for active automata learning algorithms, but the Conflict-Aware Active Au
→
PDF
9 months ago
NCTE 记录:小学数学课堂记录数据集
通过分析教室话语可窥探教学及学习背后的因素,本文介绍了迄今规模最大的数学类教室话语记录数据库,通过自然语言处理学习对话交互语言并探究其与优质教学评估及学生学习成果的关系,为研究者、教育者和政策制定者提供了参考价值。
PDF
2 years ago
NIPS
从观测数据推断因果关系时考虑隐藏的共同原因
本文讨论探讨了一种新的方法,可以通过观察数据中隐藏的共同原因进行推断和检验因果关系,而不是直接基于假设。
PDF
7 years ago
Prev
Next