Oct, 2022

机器阅读理解的模块化方法:任务感知专家混合

TL;DR该论文介绍了一个针对较小数据集的任务感知专家网络混合模型,重点研究常识学习问题,并通过训练不同的专家网络来捕获每个段落、问题和选项三元组之间不同类型的关系,同时灵感来自多任务和迁移学习的最新进展。通过将多个网络融合,强制实现它们的特定目标和关系,作者达到了最先进的结果并减少了过拟合。