Jun, 2024

任务导向领域内数据增强

TL;DR利用任务导向的领域特定数据增强框架,从通用语料库中选择大量领域内数据并生成合成的领域特定文章,以提升大语言模型在广告和数学领域的表现。平均来说,该框架可使广告领域性能提高 8%,数学领域提高 7.5%。