- 间歇、异步专家反馈对贝叶斯优化的实用性如何?
用一种非阻塞的方式引入少量的随机专家反馈来改善贝叶斯优化,进而在自动科学发现中提高探索性能和数据效率。
- 层级文本反转下的高效分子生成
提出了一种新的数据高效分子生成方法 —— 分层文本反转分子生成(HI-Mol),通过多级嵌入来反应分子分布的多层次特征,进而在少量训练数据的情况下生成高质量的分子。
- ICLR参数和数据高效的光谱风格 DCGAN
我们提出了一种简单、高参数和数据高效的对抗网络 (Spectral Style-DCGAN 或 SSD),用于无条件的人脸生成,仅使用 657.4 万个参数和来自动物面部 HQ (AFHQ) 数据集的 4739 张狗脸图像作为训练样本,在低 - 一种数据和运行高效的分层地点识别流程的局部位置图和关注局部特征
本文提出了一种运行时和数据高效的分层视觉场所识别(VPR)管道,通过结合数据驱动和免训练方法,在降低训练数据和影响训练与应用阶段分布差异方面取得了良好的平衡,该方法在大规模应用中表现出了更好的性能。
- 面向患者个体化分割的部位感知个性化段落模型
通过引入新的局部感知提示机制,本研究提出了一种数据高效的个性化图像分割方法(P^2SAM),能够在不进行模型微调的情况下,仅利用一次性病人特定数据实现对新病人的无缝适应,大大提高了性能并在不同应用领域展示出了出色的通用性。
- 利用自我合成的复述减轻大型语言模型中的灾难性遗忘
使用自我生成的实例进行演练的自我合成复述(SSR)框架可在没有原始训练数据的情况下进行持续学习,保留了 LLMs 的学习能力并表现出与传统的基于复述的方法相媲美的性能。
- 数据高效的事件相机预训练通过解耦蒙版建模
我们提出了一种新的数据高效的基于体素的自监督学习方法,克服了以往方法的局限性,该方法通过预训练克服了通过将事件序列转换为 2D 图像以利用预训练图像模型,或直接使用成对图像数据进行知识蒸馏以增强事件流学习的方法所带来的对时间信息的牺牲。我们 - RECOST: 基于外部知识引导的数据高效训练指导优化
使用外部知识与基于上下文的相对预测熵评估由大型语言模型合成的样本,并结合多样性一致性抽样,提出了一种名为 RECOST 的框架,通过在合成数据集中实验展示了方法的有效性,并仅使用全数据集的 1%即可获得更好的结果。
- 条件独立性的实用核检验
描述了一种数据高效、基于核的条件独立性统计检验方法,通过数据拆分、辅助数据和更简单的函数类别等方法,控制偏差并校正测试水平,适用于合成和真实数据。
- 神经网络知识编辑调查
深度神经网络在学术界和工业界越来越普遍,在各个领域和相关任务上与人类的表现相媲美甚至超越。然而,即使是最大的人工神经网络也会出错,随着时间的推移,曾经正确的预测可能会失效。通过在数据集中增加考虑错误或最新信息的样本,可以解决这个问题。然而, - CoT3DRef: 链状思考数据高效 3D 视觉定位
设计一种可解释的 3D 视觉定位框架,通过预测一系列锚点和最终目标,将 3D 视觉定位问题形式化为序列到序列任务,将指称任务分解为可解释的中间步骤,从而提高性能并极大地提高数据效率。
- 医学图像分析的高效数据深度学习:综述
进行全面回顾医学图像分析数据有效深度学习方法,将其按照所依赖的监督水平进行分类,并进一步细分为多个子类,研究常用的数据集和未来的研究方向。
- 基于归纳逻辑编程的一次性学习用于文本分类的研究
通过研究推断逻辑编程方法以及利用概念网络中提取的常识背景知识,本文探讨了一种一次性文本分类的机器学习技术,结果表明可以通过少量训练样例来学习文本分类规则,并且选择的样例复杂度越高,结果的准确性越高。
- 基于贝叶斯推断的数据有效性、可解释性和安全性机器人运动规划:综述
本文系统研究了贝叶斯推断法在机器人运动规划中的应用,重点讨论了策略、训练数据及其在实际任务中的应用。
- MDViT:用于小型医学影像分割数据集的多领域视觉 Transformer
本文提出了 MDViT,这是第一个包含领域适配器的多领域 ViT,通过自适应地利用多个小型数据资源 (领域) 中的知识来减轻数据饥饿和对抗 NKT,实现增强跨领域的表示学习。在 4 个皮肤病变分割数据集上的实验表明,MDViT 胜过了最先进 - VIPriors 3: 数据高效深度学习的视觉归纳先验挑战
本文介绍了第三届 “VIPriors:基于视觉归纳先验的数据有效深度学习” 研讨会,旨在解决训练计算机视觉任务的深度学习模型的数据可用性限制,其中的四项挑战任务取得了显著进展,主要归功于数据增强策略、模型融合技术和自监督表示学习等方面的贡献 - 多语言翻译的像素表达和数据效率跨语言迁移
使用像素表示方法来训练多语言机器翻译模型,实现了与子字嵌入相媲美的性能,并发现像素表示具有无缝跨语言迁移和比扩展词汇等替代方法更高的数据效率
- 无需迁移的数据高效多语言槽位标注
利用 TWOSL 方法,可以跨语言自动抽取并归类任务相关信息,即使缺乏标注数据,也能完成快速且数据高效的多语种对话标记。
- ACL基于程序引导推理的事实核查复杂声明
本文提出了一种 Program-Guided Fact-Checking(ProgramFC)模型,通过生成推理程序指导验证过程并将每个子任务委托给相应的子任务处理程序,将复杂的索赔分解为更简单的子任务,从而使我们的模型具有解释性和数据效率 - 基于 VQ-VAE-2 和有限数据训练 PixelCNN 的分阶段数据增强
通过阶段性数据增强的方式,提出了一种对于有限数据进行有效训练 PixelCNNs 模型的方法,并在数量和质量上优于传统的大数据训练模型。