- GM-DF:广义多场景深假检测
该文研究了多样本领域深度伪造检测模型的泛化能力,提出了一个广义多场景深伪检测框架,并通过领域对齐损失强制调整模型以表示多个数据集中的特定和共同的真实 / 伪造特征。在多源数据上进行的定性和定量实验表明了该方法的有效性。
- 无需使用 Deepfake 的 Deepfake 检测:通过合成的频率模式注入进行泛化
通过在图片生成过程中注入不同频率的合成模式,提高了深度伪造检测器的泛化能力。使用该方法训练的模型能够实现先进的深度伪造检测,并能有效地识别任意生成技术产生的深伪造。
- 基础模型的嵌入表示或许能够检测分布偏移
通过在预训练的 GPT-2 模型上进行情感分类的迁移学习案例研究,我们发现训练集和测试集之间的分布变化使我们无法准确了解神经网络模型的泛化能力。
- 神经网络中从损失平坦性到压缩表示的简单连接
深度神经网络的泛化能力在参数空间的损失景观形状和特征空间(即单位活动的空间)的表示流形结构两个不同的方法中已经被研究,但很少一起研究并显式连接。我们提出了一个简单的分析,建立了它们之间的联系,并展示了表明在深度神经网络的学习的最后阶段,神经 - 图神经网络从结构信息中可得证明的益处:视作特征学习角度
本研究旨在通过研究梯度下降训练中神经网络中的特征学习理论中图卷积的作用,提供了两层图卷积网络与两层卷积神经网络之间的信号学习和噪声记忆的不同表征,发现图卷积显着增强了对手 CNN 的良性过拟合的范围,并且在梯度下降训练后, GNNs 和 M - 面向野外视频质量评估的鲁棒性文本提示语义标准
提出了一种基于文本的语义相关质量评价方法 (SAQI) 及其本地化版本 (SAQI-Local)。通过与现有低级指标结合,提出了统一盲视频质量指数 (BVQI) 及其改进版 (BVQI-Local),并通过有效的微调方案,实现了优于普遍基于 - 图神经网络的测试时间训练
本研究提出了第一个用于 GNN 的测试时间训练框架,主要包括一种新颖的测试时间训练策略和自监督学习方法,以提高模型的泛化能力,并在基准数据集上进行了实验,证明了该框架的有效性,特别是在训练集与测试集之间存在分布偏移时。同时,研究者还通过探索 - 面向广义欠采样 MRI 重建的物理深度神经网络
通过引入基于物理原理的 DNN 架构和训练方法来提高 DNN 方法在 MRI 重建中的泛化能力,该方法通过采用不同的欠采样蒙版产生的数据来鼓励模型推广 MRI 重建问题,在 Fast-MRI 数据集上的实验结果表明,我们的方法在解决 MRI - 利用局部流形平滑性预测跨领域泛化能力
提出了一种基于本地流形平滑度的分类器复杂度度量方法,其定义了分类器对于给定测试点周围流形邻域干扰的输出灵敏度,通过数据增强技术采样点估算平滑度,实验结果表明,该方法与实际的越域泛化之间存在强有力的相关性。
- ACL(不) 解决形态变化:词形重叠人为地提高了模型的性能
使用基于词元的训练 - 测试分割方法重新评估形态学屈折模型,结果表明对于不同的语言模型的泛化性能有着不同程度的影响,尤其对于低资源语言的影响更大。
- ACL通过真实性探索神经 NLI 模型中的传递性
本文旨在研究表明了深度学习在自然语言处理方面的取得的成功,然而,对于它们能否展示出人类一样具有自然语言理解的概括能力的范围还不清楚。我们在自然语言推理领域探讨了这个问题,侧重于推理关系的可传递性,这是一种系统地进行推理的基本属性。结果表明, - ICMLS2SD:深度度量学习中同时基于相似性的自蒸馏
本文提出了一种名为 S2SD 的新方法,将基于相似性的自我蒸馏应用于 Deep Metric Learning 模型中,通过辅助高维度嵌入和特征空间的知识蒸馏,在保持测试时间成本不变的情况下,实现推理性能的显著提升。实验结果表明,该方法能够 - 多任务深度神经分类器中的泛化问题:基于统计物理学的方法
本论文通过应用无序系统的统计物理学技术,对解决使用 softmax 输出和交叉熵损失的分类任务的深度神经网络的推广进行非线性动力学的分析,以理论上支持多任务学习表现由任务的噪声性以及输入特征对其的对齐程度来决定的直觉。
- COOS 数据集和基准,用于测量图像分类器的外部样本泛化能力
通过使用显微镜图像,创建一个公共数据集来评估图像分类器的泛化能力,发现大多数分类器表现良好在类似于训练数据集的测试数据集上,但是它们不能泛化到具有更大协变量偏移的数据集上。
- ECCV基于加权核密度估计的快速动态路由
通过优化胶囊网络中的动态路由方法,提高路由效率,以实现与其他领先方法相媲美的性能表现。