- 深度聚类综述:从先验角度
基于神经网络的深度聚类在分析高维复杂现实世界数据方面取得了巨大成功,然而现有工作往往忽视了深度聚类中先验知识的融合和利用,本文通过对各种先验知识进行分类,提供了全面的深度聚类方法综述,并提供了五个广泛使用的数据集的基准测试和方法性能分析,希 - 学习可解释的公平表示
利用在表示学习过程中引入可解释的 “先验知识”,我们提出了一个学习可解释公平表达的通用框架,并在 ColorMNIST 和 Dsprite 数据集上进行实验证明,在下游分类任务中,与最先进的公平表达相比,我们的表达不仅可解释,而且准确性稍高 - 综合先前策略解决新任务
多任务强化学习通过提供一种常见的形式化方法 IKH,聚焦于多任务强化学习的模块化和组合性,以增强智能体在动态环境中的学习和适应能力。
- MLLM-SR:基于多模态大型语言模型的对话符号回归
基于多模态大型语言模型,提出了一种对话式符号回归方法 MLLM-SR,可以通过使用自然语言指令描述需求来生成满足要求的表达式。通过在 Nguyen 数据集上的实验证明 MLLM-SR 在拟合性能上超过了现有方法,并且可以很好地理解添加到自然 - 使用惩罚最小二乘法施加形状约束的符号回归
本文研究了在符号回归(SR)的参数估计步骤中添加形状约束及其考虑。我们提出了使用基于梯度的数值优化来最小化参数估计期间的形状约束违规。通过对合成数据集进行测试,我们评估了三种算法变体的性能,以识别出三个符号表达式。结果表明,当数据稀缺时,将 - 使用归纳先验学习三维机器人感知
通过使用结构性归纳偏差和先验知识,在机器人感知问题中提出了多种先验知识的来源和编码方法,以解决物体定位、决策制定和场景理解等挑战性问题。
- ICML动态环境下的在线线性回归与折扣
我们开发了一种用于在线线性回归的算法,即使在完全没有先验知识的情况下,也能实现最佳的静态和动态遗憾保证。
- PLUG: 使用基础模型和分层关注重新审视非模态分割
研究论文旨在通过 SAM 方法提出了一种新的分层焦点框架,应用先验知识进行图像的完整形状预测,提高精度和性能。
- 基于扩散模型和定制 CLIP 分类器的水下图像增强
我们提出了一种新颖的水下图像增强方法,通过利用多导向扩散模型进行迭代增强。我们使用图像合成策略并结合对比语言 - 图像预训练(CLIP)来训练一个控制扩散模型生成过程的分类器,在高频区域提出一种快速微调策略,结果表明我们的方法具有更自然的外 - 递归 PAC-Bayes:一种在没有信息损失的情况下对顺序先验进行频率论更新的方法
PAC-Bayesian analysis allows sequential prior updates with no information loss and has significant improvements in empir - 通过视觉和文本的知识渗透实现人类级别的少样本学习
提出了一种名为 BiKop 的一致的双向知识渗透策略,该策略通过建立层次化的联合常规 - 特定表示,并在训练过程中分离基础类相关语义,以减轻对潜在新颖类相关信息的抑制,从而在四个具有挑战性的基准测试中展示了 BiKop 的显着优越性。
- 神经网络的函数外推及其在流形中的应用
利用神经网络对函数进行估计,结合先前知识提出了一种改进的损失函数,提供了对插值和外推区域的更准确和稳健的方法.
- ACL通过对比解码增强大型语言模型中的上下文理解能力
大型语言模型在生成文本时常常不能充分整合输入上下文,过度依赖模型参数中的编码先验知识,导致生成的文本存在事实不一致或上下文不忠实的内容。本研究提出了一种新颖的方法,利用对抗性无关信息作为负样本,通过对比解码来增强生成过程中的强大上下文基础。 - RAG 模型的忠实程度:量化 RAG 与 LLMs 内部先验之间的博弈
通过系统分析语言模型的内部知识和检索信息间的冲突来回答疑问,我们发现正确的检索信息可以修复大多数模型错误,但当参考文档中存在错误信息时,模型的内部知识对该错误信息存在较大的依赖性。这些结果突显了模型的先验知识与参考文档中呈现的信息之间的潜在 - 我们能否摆脱自我监督学习中的强数据增强?
自我监督学习(SSL)作为应对深度神经网络(DNNs)中有限标记数据挑战的一种有前途的解决方案,具有可扩展性潜力。本研究全面探索了 SSL 在各种数据增强中的行为,揭示了它们在塑造 SSL 模型性能和学习机制方面的关键作用。利用这些见解,我 - 层级洞察:利用结构相似性进行可靠的 3D 语义分割
通过抽象的学习规则,我们提出了一种训练策略,使得三维光达语义分割模型能够学习不同类别之间的结构关系,从而提高模型的置信度校准,并为融合、预测和规划等下游任务保留附加信息。
- 关系抽取的二维特征工程方法
本论文提出了一种基于二维句子表示的二维特征工程方法,用于关系提取任务,经过在三个公共数据集上的评估,达到了最先进的性能,结果表明二维特征工程可以充分利用二维句子表示和传统特征工程中的先前知识。
- CVPR无先验源信息混合音频中学习视觉定位声源
本文提出了一种新颖的多声源定位方法,可以在不需要声源数量先验知识的情况下实现准确的声源定位。该方法利用迭代对象识别模块识别声音制造物体,并通过对象相似性感知聚类损失指导迭代对象识别模块有效地合并相同物体的区域,同时区分不同的物体和背景。通过 - LSKNet: 一种面向遥感的基础轻量级骨干网络
该研究考虑了远程感知场景中的先验知识,并提出了轻量级大型选择性核网络(LSKNet)作为其骨干网络。LSKNet 能够动态调整其大空间接受野,以更好地建模远程感知场景中各种对象的范围背景。通过在常规远程感知分类、目标检测和语义分割基准上取得 - 通过显式和隐式先验知识的融合推动可泛化的远程生理测量
本文提出了一种利用远程光电容积图术(rPPG)任务中的显性和隐性先验知识的新框架,通过系统分析不同领域的噪声源,并将这些先验知识纳入网络进行训练,同时利用两个分支网络通过隐式标签相关性去除噪声并提取生理特征分布,我们的实验证明,该方法不仅在