Apr, 2024

IDIL: 意图驱动专家行为的模仿学习

TL;DRIDIL 是一种新颖的模仿学习算法,旨在模拟专家的多样化意图驱动行为。其通过从不同示范中估计专家意图并将其用于学习意图感知模型,能够胜任高维状态表示下的顺序任务,而不涉及相关技术的复杂性和缺点。创造性地生成模型的实证结果表明,IDIL 所生成的模型在任务性能指标上要么与最新的模仿学习基准相匹敌,要么超越其表现。此外,作为一种生成模型,IDIL 在人机交互关键的意图推断指标上表现出卓越的性能,并恰如其分地捕捉了广泛的专家行为。