May, 2024

基于自我指导的事实验证:解释性和泛化性挖掘

TL;DR本研究提出了一种基于自我指导的微调方法,通过数据增强和改进的 DPO 微调,实现了在保持准确性的同时,生成流畅的解释文本,并展示出高泛化性能。