Feb, 2024

学习还是自我调整?重新思考指令微调

TL;DR通过知识干预框架,我们揭示了指导微调的潜在机制,并为最近和可能的未来工作提供了强有力的支持。