ACLMar, 2024
MT-PATCHER:面向机器翻译的大型语言模型的选择性和可扩展知识蒸馏
MT-PATCHER: Selective and Extendable Knowledge Distillation from Large Language Models for Machine Translation
Jiahuan Li, Shanbo Cheng, Shujian Huang, Jiajun Chen
TL;DR通过提出 MT-Patcher 框架,将知识从大型语言模型传输到中型机器翻译模型,仅识别和纠正学生翻译模型的翻译错误,而不是将整个翻译知识从教师模型中提取,通过利用大型语言模型的语言能力,预测学生的潜在错误和多样化的语境提高翻译性能。