ACLNov, 2023

Mukhyansh:面向印度语言的标题生成数据集

TL;DR该研究提出了 Mukhyansh 数据集,其中包含超过 3.39 百万个印度语言标题 - 文章对,用于解决印度语言标题生成中缺乏高质量标注数据的问题,并通过实证分析证明其表现优于其他模型,跨 8 种印度语言平均 ROUGE-L 得分为 31.43。