Oct, 2022

对话响应选择任务自适应预训练

TL;DR本研究旨在验证先前论文中提出的关于初始化选择的假设和理解 DRS 改进的来源,研究表明使用 RoBERTa 初始化的性能与 BERT 类似,而 MLM+NSP 可以优于先前提出的所有 TAP 任务,并且 NSP 任务对于 DRS 非常重要,与常见的 NLU 任务不同,通过 TAP 步骤是 DRS 改进的主要来源。