Mar, 2024
MT-PATCHER:面向机器翻译的大型语言模型的选择性和可扩展知识蒸馏
MT-PATCHER: Selective and Extendable Knowledge Distillation from Large
Language Models for Machine Translation
TL;DR通过提出MT-Patcher框架,将知识从大型语言模型传输到中型机器翻译模型,仅识别和纠正学生翻译模型的翻译错误,而不是将整个翻译知识从教师模型中提取,通过利用大型语言模型的语言能力,预测学生的潜在错误和多样化的语境提高翻译性能。