Mar, 2024

MT-PATCHER:面向机器翻译的大型语言模型的选择性和可扩展知识蒸馏

TL;DR通过提出MT-Patcher框架,将知识从大型语言模型传输到中型机器翻译模型,仅识别和纠正学生翻译模型的翻译错误,而不是将整个翻译知识从教师模型中提取,通过利用大型语言模型的语言能力,预测学生的潜在错误和多样化的语境提高翻译性能。