基于表格的事实验证与自适应专家混合模型
本文提出一种新颖的系统,利用因果关系理论,通过探测式显著性估算方法确定语句的令牌级显著性,从而尝试在文本语句与表格数据之间建立联系和推理,进而应用显著性感知的数据增强技术来生成更多样化的训练实例,并结合该技术在 TabFact 数据集上取得了超过所有先前方法的最优性能。
Sep, 2021
本文介绍 TabFact 数据集,其中包含 118k 人工标注的自然语言陈述,并以 16k 个 Wikipedia 表格作为证据,同时介绍了 Table-BERT 和 LPA,这两种算法都能在半结构化数据情况下进行事实验证,都有优点和不足之处,但是都能被进一步开发优化。
Sep, 2019
本文提出了一种分解复杂语句为简单子问题,并以程序为指导构建伪数据集进行分解模型训练的方法,从而增强事实验证模型的中间证据,通过实验证明,在 TabFact 基准测试中取得了 82.7%的最新最佳性能。
Sep, 2021
本文描述了我们在 2022 AAAI 多模态事实验证(Factify)挑战上的参与系统。 我们处理该挑战为多模态蕴含任务,作为多类分类,并提出并探索了两种基线方法,包括集成模型和多模态注意力网络。 我们在此工作中测试了不同 SoTA 预训练变换器和视觉模型。 最佳模型在排行榜中排名第一, 平均 F - 度量值为 0.77。 最后,我们强调了未来研究的任务和多模态数据集的挑战。
Dec, 2021
本研究旨在解决在科技论文中理解表格结构与表格内容,主要通过提供一个包含这些信息的数据集和 SemEval 任务挑战赛中两个子任务的方式来实现,共有 69 个团队参与,19 个成功提交了子任务 A 的结果,12 个成功提交了子任务 B 的结果。
May, 2021
本文提出了一种基于 BERT 模型的句子级多任务学习模型,可用于事实验证任务,并通过联合训练模型的理由选择和态度预测来实现反击社交媒体或新闻网站上不断传播的错误信息的目的。
Dec, 2020
本文基于 TAPAS 模型扩展 BERT 框架以理解表格语义结构,在 SemEval-2021 任务 9 中解决表格事实的声明验证和证据查找问题,并通过在表头行上进行规范化来优化 TAPAS 在子任务 A 中的表现,在子任务 B 中引入不同的 fine-tuning 策略来提高模型准确率,模型在三种分类任务下分别取得了 67.34、72.89 和 62.95 的 F1 分数。
Jun, 2021
通过自我监督特征蒸馏的 SFAVEL 方法,无需注释,实现了高质量事实验证和证据对齐,并在标准 FEVER 事实验证基准上取得了 + 8% 的准确率提升。
Sep, 2023
探索一种强大的问答系统的模型体系结构,其中使用了 Mixture-of-Experts 模型来训练具有更好鲁棒性的多任务学习器,该模型还使用了 DistilBERT 来生成问题向量;数据增强技术包括 Easy Data Augmentation (EDA) 和 back translation。通过这些方法,所提出的模型在严格的测试中实现了 53.477 F1 分数,比基线模型提高了 9.52%。该研究成功地证明了 Mixture-of-Expert 体系结构在 Robust QA 任务中的有效性。
Mar, 2022
提出了 Logic-level Evidence Retrieval and Graph-based Verification network (LERGV) 框架,将基于表格的事实验证任务作为证据检索和推理框架来进行,通过检索逻辑级别证据和构建基于图的推理进行最终蕴含关系的分类。在大规模基准数据集 TABFACT 上的实验结果表明了所提出方法的有效性。
Sep, 2021