- 知情元学习
在实际应用中,机器学习在嘈杂和低数据的环境下面临一个重要挑战,即如何有效地整合具有数据效率和鲁棒性的归纳偏好。本论文通过介绍一种新的混合范式,即信息元学习,旨在实现人类和机器之间跨任务知识共享的互补性,为信息元学习的基本组成部分和具体实例 - 文本到图像模型在视觉模态缺失的多模态学习中的应用
通过用生成式变压器填补缺失的视觉数据,我们提出了一个简单但有效的多模态学习框架 GTI-MM,以增强数据效率和模型的鲁棒性,尤其是对于缺少视觉模态的情况。我们在多个多模态数据集上进行了全面的分析,包括模型的训练,结果显示合成图像有助于训练数 - ICML等变对称性破缺集
我们提出了一种全等变性的新颖对称性破缺框架,通过将一组对称性破缺对象输入网络来实现,最小化这些集合的大小等效于数据效率。我们证明了最小化这些集合相当于一个被广泛研究的群论问题,并提供了对点群问题的解决方案,通过一些破对称性的示例来展示我们的 - 提升伪标记和改善半监督领域泛化的鲁棒性
我们提出了一种新的半监督领域泛化方法,利用模型平均的不确定性引导伪标签技术,在有限标签的情况下缓解对源领域的过拟合,并在关键代表性领域泛化数据集上证明了其有效性。
- 打开黑盒子:基于步骤的策略更新用于有时间相关性的情节式强化学习
当前强化学习的研究主要关注于学习基于步骤的策略,而忽略了动作之间的时间相关性,本文介绍了一种新颖的强化学习算法,Temporally-Correlated Episodic RL (TCE),该算法有效地利用了步骤信息并在参数空间中打开了现 - E3x: E (3)- 等变深度学习简易化
这项工作介绍了 E3x,这是一个用于构建神经网络的软件包,它对于欧几里得群 E (3) 是等变的,包括三维空间的平移、旋转和反射。与普通的神经网络相比,E (3) 等变模型在输入和 / 或输出数据为与三维对象相关的量时具有优势。因为这些量的 - AAAICoSS: 为数据高效的人体活动识别协同优化传感器和采样率
通过设计可训练参数来优化传感器模式和采样率的选择,我们提出了一个实用的框架,用于在边缘设备上实现高效的人体活动识别任务,并通过实验证明了该框架在减少硬件成本的同时能够保持与最高采样率和全传感器配置相似的分类性能。
- NODEC: 用于未知动态系统的神经常微分方程优化控制
通过耦合的神经 ODE 模型,NODEC 实现了对未知动力学系统的控制以及目标状态下的优化控制,展示了其在学习未知动力学系统的最优控制方面的有效性和数据效率。
- MLIP:医学语言 - 图像预训练与遮蔽局部表示学习
本文旨在通过引入多对多局部关系建模来增强数据效率,从而更有效地利用有限的医学图像文本数据。我们提出了医学语言 - 图像预训练(MLIP)框架,通过补丁 - 句子匹配的方式更有效地利用图像 - 文本医学数据,同时引入遮蔽对比学习策略和语义完整 - 运动基元扩散:学习可变形物体的轻柔机器人操纵
机器人辅助手术中的政策学习存在数据效率低和多功能性方法不足的问题,本研究引入了运动原始扩散(MPD),一种新的机器人辅助手术中的模仿学习方法,专注于可变形物体的轻柔操控,通过将扩散型模仿学习(DIL)的多功能性与概率动态运动原始(ProDM - AAAITiMix:文本感知的图像融合 用于高效视觉语言预训练
Self-supervised Multi-modal Contrastive Learning (SMCL) 模型通过整合视觉和语言模态,使现代视觉 - 语言预训练(VLP)模型在无监督学习方面取得显著的进展。然而,由于网络采集的文本 - - EquiReact: 化学反应的等变神经网络
在化学反应的推理中,我们引入了一个基于三维结构的反应物和生成物构建的等变神经网络 EquiReact,展示了它在 GDB7-22-TS、Cyclo-23-TS 和 Proparg-21-TS 数据集的活化能预测中的竞争性能,对于原子映射信息 - Minimax Exploiter: 数据高效的竞争自我对弈方法
通过对对手知识的利用,我们提出了一种博弈论方法,即 Minimax Exploiter,在竞争性自博弈的多智能体强化学习中显著提高了数据效率,并在不同环境下验证了其超越强基线的性能。
- 用稀疏输入描述视频问答
在视频问答中,我们使用基于 Gumbel 的可学习选择模块来自适应地选择最佳的输入,以实现对视频及语言任务的数据效率改进。我们的实验证明,即使在高度稀疏的设置下,我们只选取每个视频的 2-4 帧,视频长度仅为总长度的 10%,也仅仅损失了 - AAAI通过自然语言以人工反馈聚合大规模语言模型数据对齐
通过模型中人类反馈的学习,改进大型语言模型(LLMs)的输出与人类期望的一致性,利用人类反馈信号中以响应对的排名形式的强化学习,研究使用自然语言反馈模型的数据效率,通过对 ChatGPT、BARD 和 Vicuna 等模型的反馈逐渐改进,提 - 坎丁斯基共形预测:图像分割算法的高效校准
图像分割算法可以理解为一组像素分类器,其中相邻像素的结果是相关的。我们提出的方法,称为 “肯丁斯基校准”,利用自然图像分布中的空间结构,同时校准 “相似” 像素的分类器,从而更有效地利用可用于校准的图像。通过在公共 MS-COCO 和 Me - 不需要在策略采样的强化学习中的同策略策略梯度
透过引入自适应的离策略采样方法,本文提出了一种能够改进策略梯度算法数据效率的采样方法 PROPS 去减少采样误差并通过调整旧策略的数据分布使其接近策略梯度算法的数据要求,实验证明此方法能够减少采样误差并提高策略梯度算法的数据效率。
- LayoutPrompter: 唤醒大型语言模型的设计能力
条件图形布局生成的研究,通过上下文学习以增强数据效率和通用性,提出了基于大型语言模型的 LayoutPrompter 方法。在各种布局生成任务上的实验证明了 LayoutPrompter 方法在低数据情景下的优越性能。
- ETDPC:电子学位论文页分类的多模态框架
提出了一种基于两流多模型和交叉注意网络的电子学位论文页面分类方法,该方法在数据效率方面取得了较好的效果,并在 13 个类别中的 9 个类别上取得了 0.84-0.96 的 F1 值,优于现有模型。
- 理解何时动力学不变数据增强对无模型强化学习更新有益
数据扩增在强化学习任务中提高数据效率的实验研究中起关键作用,增加状态 - 动作覆盖范围对数据效率的影响明显大于奖励密度的增加,同时减少扩增回放比显著提高数据效率。