评估表示学习中的组合性
本篇论文从识别可表达性学习出发,将组合性视为数据生成过程的属性而非数据本身,并提出了仅取决于训练分布和模型架构的轻微条件,为组合泛化建立了理论框架,并验证了其应用于现实世界场景的结论,从而为组合泛化的原则性理论研究铺平了道路。
Jul, 2023
本文探讨了人类学习机制中的组合性问题,并扩展了先前针对自然语言的神经网络研究到数学推理领域。研究发现,神经网络不仅能够学习到训练数据中的结构关系,而且能够将这些知识用于指导复合意义的组合。
May, 2021
本文讨论在预先训练的视觉与语言模型中向量数据嵌入的组合结构,提出一种基于理想词向量的新的合成性表达方法,并探讨其与数学表示理论和去耦合表示概念的联系。作者提供理论和经验证据表明,理想词嵌入提供良好的组合近似和比基于标记的分解更有效的组合表示方法。
Feb, 2023
介绍了一种广泛适用的形式主义,即组合问题图,以解决机器学习中不利于推广的问题,提出了组合泛化问题并引入组合递归学习器,该框架适用于学习算法过程以组合表示转换,从而产生能够进行推理的学习器。
Jul, 2018
通过引入简单的正则化技术以及利用类别级别属性注释对神经网络进行特征空间分解,本工作试图弥合深度学习模型与人类学习之间的鸿沟,证明组合表示的价值并展示少量样本即可学习新类别的分类器。
Dec, 2018
本文探讨了现代语言模型是否能够学会表示复合短语中的复合性和非复合性,通过预测长语的内部表示来证明了现代语言模型可以预测一个父短语的表示。同时,通过多种分析,揭示了不同类型的语言模型何时产生了复合表示,并探讨了未来建模工作的可能性。
Oct, 2022
文章介绍了一种可以精确和控制地针对句向量中的组合含义信息的方法,利用一个专门的句子生成系统,创建遵循特定句法、语义和词汇约束条件的带注释的大型句子集。实验表明,这种方法能够从多种现有的句子表示模型中提取有用的信息,有助于理解这些系统对句子信息的捕获能力。
Sep, 2018
本文探讨了使用不同的自监督学习算法所学到的表示在复合泛化上的能力,研究发现,与其它算法相比,使用 EL 模型学习到的表示具有更强的复合泛化能力,但在训练简单模型并使用少量标签进行泛化时直接使用瓶颈表示会导致泛化性能较差,同时现有的度量复合性的指标与本文的评价方法不相关
Oct, 2022
综述了有关计算模型和认知研究中的组合学习的文献,并连接了认知和语言模型在组合推理中面临的计算挑战。概述了形式定义、任务、评估基准、各种计算模型和理论发现,并介绍了大型语言模型的现代研究,以深入了解尖端人工智能模型展示的组合能力,并指出了未来研究的重要方向。
Jun, 2024
该研究介绍了一个名为 ConceptWorld 的环境,用于生成通过逻辑领域特定语言定义的构成和关系概念的图像。研究测试了标准神经网络和关系网络的泛化能力,并提出了一个潜在的基准模型,以鼓励在构成和关系领域有效泛化的模型的发展。
Jun, 2020