BriefGPT.xyz
Jun, 2023
模仿学习中的数据质量
Data Quality in Imitation Learning
HTML
PDF
Suneel Belkhale, Yuchen Cui, Dorsa Sadigh
TL;DR
本文研究如何定义训练数据集的质量以及如何通过掌握数据质量来解决分布偏移的问题,其中主要包括两个关键性质:行动偏差和转移多样性。探究了这两种关键性质对任务学习的影响,并在实验中对不同来源的数据进行了分析,得出了状态多样性不总是有益的结论,同时演示了行动偏差和转移多样性是如何相互作用的。
Abstract
In
supervised learning
, the question of
data quality
and curation has been over-shadowed in recent years by increasingly more powerful and expressive models that can ingest internet-scale data. However, in
→