- 通过学习密度比进行拒绝
通过改变监督学习流程和优化损失函数的风险,提出了一种以拒绝为基础的学习范式,通过利用密度比率来决定模型的拒绝决策,并在干净和噪声数据集上进行了实证测试。
- ICML基础代理:决策制定的范式转变
决策制定需要通过知觉、记忆和推理之间的复杂相互作用来识别最优策略。本文提出基于基础代理的构建作为学习代理的一种变革性转变,旨在解决决策制定中面临的低样本效率和泛化能力差的挑战。通过从大型语言模型(LLMs)获得启示,明确了基础代理的基本特征 - 逐项列出:多模式 LLM 的新数据源和学习范式
通过对图像上的视觉标签列表项化,将视觉标签与图像关联起来,研究表明这种新的训练范式可以提升 Multimodal Large Language Models 的视觉推理能力和减少幻觉,并加强对象 - 文本对齐。
- 有意义的学习:通过通用事实指导提升大型语言模型的抽象推理能力
我们设计了一个初步的研究,以量化和深入探讨现有大型语言模型的抽象推理能力。我们的结果显示,我们的方法不仅提高了大型语言模型的一般推理性能,而且在抽象推理能力方面取得了可观的进展,从简单的记忆或模仿转向了更加精细的对通用事实的理解和应用。
- ICLR为什么问题的动态视角
我们研究了随机过程生成的多变量时间序列数据中的因果推理。与现有方法不同,我们提出了一种直接建立时间过程中事件之间因果关系的学习范式,并通过两个关键引理将其框架化成为强化学习问题。我们的方法提供了揭示和量化扩散过程中因果关系的形式化和计算工具 - 高保真基于扩散的图像编辑
扩散模型在图像生成和编辑领域取得了显著的成功。我们提出了一种创新的框架,其中包含一个修正模块,用残差特征调节扩散模型权重,以填补编辑过程中准确性的差距。此外,我们引入了一种新的学习范式,旨在在编辑过程中最小化错误传播。通过大量实验证明,我们 - 一致长期预测人人可达动力系统
在一个随机性质的遗传动力学系统下,我们研究分布的演化。通过利用 Koopman 和转移算子理论,可以将任意初始状态的分布向前演化到未来,我们研究了这些算子估计的长期预测表现。在观察到标准的估计方法在这方面可能会失败后,我们提出了一种学习范式 - 让大型语言模型能够从规则中学习
通过从详细的规则中提取知识并显式编码到大型语言模型的参数中,我们提出了一种新的学习范式,即规则蒸馏,并证明这种方法在样本大小和泛化能力方面比基于示例的学习更加高效。
- 晶格算子机器学习的超参数化范式
通过过参数化 lattic 中的元素,我们提出了一种学习模式,并应用了一种在 lattic 中最小化函数的算法,该算法是针对约束类操作符的通用算法,解决了现代神经网络方法缺乏的控制性、透明性和可解释性。
- 结构图:视觉图表理解的感知、结构化和推理
通过提出统一且高效标签的学习范式,我们在不同的下游任务中建立了一个联合感知和推理任务的框架,并通过改进图表信息处理和结构化信息提取,实现了更好的图表理解。
- 图像恢复与增强的扩散模型 —— 综合调查
图像修复是一个具有挑战性的任务,在近期,扩散模型在图像的生成上取得了显著的进展,但关于扩散模型在图像修复中的应用却鲜有综合且有启发性的研究,本文首次对基于扩散模型的图像修复方法进行全面的综述与评估,并提出了未来研究的五个潜在和具有挑战性的方 - 反复斟酌方为上策:从文本编辑中学习重新调整与人类价值的对齐
Second Thought 是一种学习模式,通过模拟未对齐和对齐的文本之间的编辑链,使用语言模型微调和加强学习进行额外的细化,不仅在三个价值对齐基准数据集中实现了优越的性能,还在少样本情境下显示出强大的人类价值转移学习能力。生成的编辑步骤 - ECCV物体追踪的大一统
提出了一种统一方法 Unicorn,可以通过单个网络和相同的模型参数同时解决四个跟踪问题 (SOT、MOT、VOS 和 MOTS),该方法采用相同的输入、主干、嵌入和头部,解决了现有跟踪器过度专业化特定任务的问题,并在包括 LaSOT、Tr - WWW交叉成对排名用于无偏物品推荐
本文提出了一个名为交叉成对排序(CPR)的新学习范式,它在不了解暴露机制的情况下实现了无偏推荐,相比现有的去偏方法具有更好的模型泛化和训练效率。
- CVPRCR-FIQA: 通过学习样本相对可分类性进行面部图像质量评估
本文提出一种学习范式以及建立基于其的面部图像质量评估算法(CR-FIQA),通过预测面部图像样本的相对分类能力来估计其质量,并通过角度空间中的训练样本表征来测量相对分类能力。该方法在面部识别模型训练中同时进行优化,并经过大量实验表明其在 8 - 开放世界特征外推:归纳图学习方法
研究了新特征数据的开放世界特征外推问题,采用基于图表示和学习的新学习范式,自监督方法和带归纳性的学习方法授予模型外推能力并缓解特征级过度拟合,经过多项实验证明比 KNN 和局部聚合方法表现优异。
- IJCAI通过神经虚幻自我对抗解决大规模的延拓形网络安全博弈
本文提出了一种基于神经虚构自我博弈的学习方法,NSG-NFSP,来解决大规模复杂形式网络安全博弈,主要贡献包括改进最佳响应策略网络,转换平均策略网络为基于度量的分类器,加入高层次动作,以及利用 NSG 图节点嵌入信息进行学习。该算法在可伸缩 - 序列多关键词生成的实证研究:顺序是否重要?
本研究提出了多个关键短语拼接作为目标序列的学习方法,研究了拼接顺序对模型行为的影响,并通过综合比较发现了一种更好的拼接顺序,总结了几个实证发现和挑战,这些可以为未来相关研究提供指导和启示。
- 不变风险最小化
介绍了不变风险最小化 (IRM) 的学习模式,通过学习数据表示来估计多个训练分布之间的不变关系,从而实现在所有训练分布上匹配最优分类器,通过理论和实验表明,IRM 学习到的不变性与控制数据的因果结构相关,并能够实现分布外概括。
- ICML让我们达成共识:神经网络在真实数据集上分享分类顺序
该研究观察到深度神经网络学习训练数据和测试数据的顺序类似,这种现象不论是在图像分类基准测试还是文本分类基准测试中均有体现,这也反映了神经网络在学习基准数据集时的相互作用并且研究了这种顺序的变化。