Mar, 2024

具有非对称距离度量的概率世界建模

TL;DR学习一个距离函数对计划和推理在表示空间中至关重要,通过非对称对比学习将概率世界动态嵌入到表示空间中,并通过一个共同参考状态,发现几何上显著的状态作为子目标,有效地发现子目标。