Jan, 2024

ProLex:面向语言能力的词汇替换基准

TL;DR通过 PropLex 基准和模型,我们提出了一项新的任务,即面向语言熟练度的词汇替换,并展示了使用特定任务合成数据对 Llama2-13B 模型进行微调的最佳模型,在 F-score 上超过 ChatGPT 平均 3.2%,并在 ProLex 上获得与 GPT-4 相当的结果。