EMNLPSep, 2021
大规模语言模型能带来哪些变革?对亿级韩语生成预训练变压器 HyperCLOVA 的深入研究
What Changes Can Large-scale Language Models Bring? Intensive Study on HyperCLOVA: Billions-scale Korean Generative Pretrained Transformers
Boseop Kim, HyoungSeok Kim, Sang-Woo Lee, Gichang Lee, Donghyun Kwak...
TL;DR介绍 HyperCLOVA,这是一个针对韩国语料库进行训练的基于 GPT-3 的大规模语言模型,在上下文中的零样本与少样本学习性能上显示出最先进的表现,还介绍了基于提示的学习的性能优化和交互式学习界面,最后给出了三个成功的应用示例。