Jun, 2024

HeSum:一个用于希伯来文抽象文本摘要的新数据集

TL;DR该论文引入了 HeSum,一个专为现代希伯来语抽象文本摘要而设计的基准测试集,其中包含从专业人士撰写的希伯来语新闻网站中获取的 1 万个文章 - 摘要对。通过语言分析,我们证实了 HeSum 的高度抽象性和独特的形态学挑战。我们展示了 HeSum 对于当代最先进的大型语言模型来说具有明显的困难,从而将其确立为希伯来语的生成语言技术以及 MRL 的生成挑战的有价值的试验平台。