该论文探讨神经网络的组成特性以及地位,提出了一种基于模块化的网络结构,利用预定的角色将模块拆分,同时提供对模块崩溃问题的解决方案,提高了整个网络的鲁棒性和解析准确性。
Jun, 2023
本文研究了深度神经网络在噪声环境中的鲁棒性和不变性,提出了快速计算稀疏对抗扰动和数据增强方法,与数据之间的特征联系起来,以实现更可靠的机器学习系统。
Aug, 2022
该研究介绍了一个名为 ConceptWorld 的环境,用于生成通过逻辑领域特定语言定义的构成和关系概念的图像。研究测试了标准神经网络和关系网络的泛化能力,并提出了一个潜在的基准模型,以鼓励在构成和关系领域有效泛化的模型的发展。
Jun, 2020
通过模块性和超网络的研究,我们证明了从有限数据中的元学习可以发现能够组合性地概括的模块化解决方案。
Dec, 2023
提出一种基于模块化体系结构和任务驱动的深度神经网络,能够在零样本情况下进行组合推理和分类,并在广义零样本分类问题上使用小模块优于现有方法。
May, 2019
通过将图像的组成元素进行组合,基于经验风险最小化 (Empirical Risk Minimization, ERM) 的训练方法在处理分布偏移时提高了模型的鲁棒性,解决了图像分类中的接近问题和图像成分之间的虚假相关性,提出了一种新的组平衡方法,无需组标签或虚假特征信息,并在相关偏移的情况下具有更好的最差组准确性。
Feb, 2024
该文章提出了一种基于数据分布的组合建模通用框架,证明了针对具有词汇表和组合函数的任何可分解任务都存在一族数据转换函数,可在训练数据上产生新的、格式正确的例子,进而说明即使在未知组合函数的情况下 (例如无法编写或推断符号语法), 也可以识别这些数据转换并对普通 RNN 和转换器序列模型进行数据增强,在 CLEVR-CoGenT 视觉问答数据集上获得了最先进的结果,在 COGS 语义分析数据集上获得了与专用模型架构相当的结果。
Jan, 2022
本文探讨了人类与计算机视觉模型在不同类型的视觉组合任务中的差异,通过大程序空间中的最佳程序来生成具有丰富关系结构的候选视觉对象,发现人类和程序感知上存在着一些相同点,同时在一些结构上存在不同,其中,形成新的概念主要涉及到的是组合机制和抽象。
May, 2023
本研究基于多种语言和哲学理论对构成性的不同解释,提出了五个理论有据的测试方法,用于评估神经语言模型的构成性能力,结果分析了三种常见神经网络结构在高度构成性数据集上的表现和潜在改进方向。
Aug, 2019
通过利用视觉模型的大规模多模态训练和其广泛适应能力,我们评估当前视觉模型对不同物体与背景环境变化的鲁棒性,并利用生成模型来产生多样化的物体与背景变化,从而量化背景环境对深度神经网络的鲁棒性和泛化能力的影响。
Mar, 2024