ACLFeb, 2023

指导学习者:基于 Token 归因相似性的专家产品去偏方法控制

TL;DR该研究探讨了使用 Product of Experts 算法和 fine-tuning 策略在自然语言推理和事实验证基准测试上改善避免数据偏差的训练模型对于分布外 (out-of-distribution) 数据的效果。