Oct, 2023
使用形式方法反馈对语言模型进行微调
Fine-Tuning Language Models Using Formal Methods Feedback
Yunhao Yang, Neel P. Bhatt, Tyler Ingebrand, William Ward, Steven Carr...
TL;DR使用自然语言任务描述,通过自动合成基于自动机的控制器,并通过与独立提供的规范进行验证,将预训练语言模型完全自动调优以适应自主系统的应用,从而在减少成本的同时弥补了通用知识和特定领域要求之间的差距,其在自主驾驶等多个任务中显示出有效性,使控制器所满足规范的百分比从 60% 提高到 90%。