ACLOct, 2022

BanglaParaphrase: 一份高质量的孟加拉语释义数据集

TL;DR本文介绍了 BanglaParaphrase,这是一个高质量的合成孟加拉语复述数据集,通过新的过滤管道筛选。我们旨在通过引入 BanglaParaphrase,提高孟加拉语在 NLP 领域的低资源状态,通过保留语义和多样性确保质量,并详细阐述我们的数据集和模型与其他现有作品之间的比较分析