Jul, 2021

HTLM: 语言模型超文本预训练和提示

TL;DR介绍了一种基于 HTML 训练的超文本语言模型 HTLM,使用 BART-style denoising loss 在简化 HTML 上进行预训练可对广泛端任务和监督级别提供高效的迁移,同时比纯文本模型表现更好,能够自动完成大部分的超文本格式转换,且零样本摘要效果最佳。