ACLSep, 2023

韩 Bird 大型:基于 Transformer 的韩语语言理解转换

TL;DR本研究介绍了一种名为 KoBigBird-large 的大规模韩语 BigBird 模型,它能够在韩语语言理解方面实现领先水平并处理长序列。通过采用作者提出的锥形绝对位置编码表示(TAPER),无需进一步预训练,只需改变架构和扩展位置编码。实验证明,KoBigBird-large 在韩语语言理解基准测试中表现出类似的领先水平,并在长序列上的文档分类和问题回答任务中展现了与竞争基准模型相比更好的性能。本研究在此公开发布了我们的模型。