Mar, 2025
语言模型、图搜索与监督污染:何时更多的监督反而更少,以及如何使更多的监督变得更有效
Language Models, Graph Searching, and Supervision Adulteration: When
More Supervision is Less and How to Make More More
TL;DR本研究关注路径星任务,这是一个在图上搜索的简单示例。研究发现,解码器仅模型(LMs)在此任务中的效果不佳,原因在于过量的监督会导致学习到的捷径。通过提出一系列解决方案,证明该任务可以通过解码器仅模型有效解决,进而为相关语言模型的训练提供了新的见解。