Sep, 2024

增强基于大语言模型的翻译时,偏好对齐是否总是最佳选择?实证分析

TL;DR本文探讨在机器翻译中,通过偏好对齐技术(CPO)提升翻译质量的有效性,解决了偏好对齐方法可能导致的评估不稳定性问题。研究发现,虽然CPO在高质量数据中优于监督微调(SFT),但在不同评估指标之间的稳定性存在挑战,同时仅依赖基础模型生成的候选翻译在一致性和性能上表现良好。