Sep, 2024
数据量到底够不够?对大型语言模型进行内部翻译的微调:跨多个数据集规模的性能评估
How Much Data is Enough Data? Fine-Tuning Large Language Models for
In-House Translation: Performance Evaluation Across Multiple Dataset Sizes
TL;DR本研究解决了大型语言模型(LLMs)在组织特定翻译中面临的细微差别与风格问题。通过利用翻译记忆(TMs)对Llama 3模型进行微调,研究表明使用更大规模的数据集能够显著提高翻译质量,尤其在软件行业的应用上具有重要的潜在影响。