Oct, 2021

序列模型中的妄想:交互和控制

TL;DR本研究讲述了如何通过将动作视为因果干预来从根本上解决大型序列模型自我建议错觉问题的难题,并结合事实和反事实误差信号的有监督学习方法,教授系统如何对数据进行调节或干预。