- Npix2Cpix:基于 GAN 的图像到图像翻译网络与检索 - 分类集成用于历史文档图像中的水印检索
本文提出了基于 U-net 的条件生成对抗网络 (简称 Npix2Cpix),用于将嘈杂的历史水印图像转换为只包含水印且无手写的清晰图像,并使用 Siamese-based 的一次性学习对水印进行分类,实验结果表明这一方法能够提高水印的分类 - 基于特征的通用预测模型:感知和抽象推理的统一
人类智能的一个特征是能够从有限的经验中推断出抽象规则,并将这些规则应用于陌生情境。本研究介绍了一个使用特征检测、仿射变换估计和搜索的算法方法来进行规则检测和应用,并在简化版的 Raven's Progressive Matrices 任务中 - 事件型预测后缀树
该论文介绍了基于事件的预测后缀树(EPST)算法,该算法受生物学启发,通过基于事件输入的统计学学习在线模型,并能够对多个重叠模式进行预测,具有可解释性、容错性、对事件噪声具有抵抗能力以及一次性学习的能力。
- 基于位置和方向的一次性学习方法用于医疗行为信号数据的识别
本文提出了一种基于位置和方向感知的一次性学习框架,用于医学动作识别。通过信号数据转化为隐私保护特征进行训练,在模型的两个阶段中引入交叉注意力和动态时间规整等模块进行信息融合,筛选重要的人体部位并减少动作识别偏见,同时采用位置和方向特征相互支 - OneSeg: 基于自学习和单次学习的用于 3D 医学图像分割的单切片标注
提出了一种基于自学习和单次学习的框架,用于 3D 医学图像分割,仅注释每个 3D 图像的一个切片以显著减少注释工作量并获得与完全监督方法相媲美的性能。
- 基于一次性唇部生物特征认证:利用认证短语信息扩展行为特征
基于唇部生物特征身份验证(LBBA)是一种基于通过相机传感器捕获的视频数据中人的唇部运动的身份验证方法。该方法利用唇部运动的物理和行为特征,不需要额外的传感设备,仅需一个 RGB 相机。本论文提出了一种将行为特征与发音内容相关联的一次性方法 - 自主车辆视觉路径导航的一次学习
本文提出了一种新颖的深度神经网络模型,利用图像转向路径导航,并加入一次性学习来处理数据问题,可以在只展示一次路径并且无需重新训练模型的情况下自主驾驶车辆。与其他候选架构比较后,通过车内和离线测试来验证了该模型的性能。
- UOD: 解剖标志通用单次检测
提出了一种医疗图像领域自适应的单次学习里程碑检测框架(UOD),通过使用两个阶段的通用模型和领域特定模块,实现了多领域无标签数据的领域偏好适应,并在 X-ray 头,手和胸部三类不同解剖部位的公共数据集上获得了最先进的表现。
- 通过代理分析提高机器人任务学习中从 LLMs 提取知识的能力
介绍了通过内置的自主机器人来扩大 LLM 响应的空间,根据语言能力、身体实体、环境和用户喜好挑选、修补、选择 LLM 提供的响应,从而使机器人能够完成 75% 以上的任务一次学习并显著减少需要人工监督的程度。
- 基于 GPT 自监督的数据标注器优化
本文提出了一种以 GPT 为基础的自监督注释方法,运用一次学习和生成恢复的范例,达到了不错的注释效果
- CoreDiff: 上下文误差调制广义扩散模型用于低剂量 CT 去噪和泛化
该论文提出了一种基于扩散模型的 LDCT 图像降噪新方法 CoreDiff, 并引入了 CLEAR-Net 以及一次性学习框架,以解决之前一些基于深度学习的降噪模型中的过度平滑和训练不稳定性问题,同时取得了在降噪和泛化性能方面的优异表现。
- OTS:一种用于历史手稿文本定位的单次学习方法
通过一种新颖的一次学习文本定位方法,即 One-shot learning-based Text Spotting (OTS) 方法,该方法结合了认知研究中的方法,通过空间对齐模块来找到并学习查询图像中最具有区分性的空间区域。同时,引入一种 - 通过大量数据增强实现新型白质束的单张分割
本文研究如何基于深度学习对白质纤维传播成像进行分割,着重研究了如何利用少量标注数据进行一次性分割,通过数据增强的方式,提高了模型对新的白质纤维传播成像的分割准确性。
- Tab2KG: 轻量级语义档案的语义表格解释
本文介绍了 Tab2KG,这是一种新的数据表语义解释方法,可以将具有以前看不见数据的表格自动推断其语义,并转换为语义数据图,而不需要通过实例查找。在多个真实世界数据集上的实验评估表明,Tab2KG 胜过现有的语义表解释基线。
- FIGO:使用 GAN 和一次性学习技术增强指纹识别方法
提出了一种基于生成对抗网络和一次学习技术 (FIGO) 的指纹识别方法,该方法包含指纹增强和指纹识别两个部分。首先,使用 Pix2Pix 模型直接将低质量指纹图像转换为更高水平的指纹图像,提高了指纹识别模型的性能。其次,使用一次学习方法构建 - 自主空中操作的单次学习
本研究旨在通过学习可转移的接触模型来实现空中操纵任务的无人机自主计算新型载荷的接触点,并在不进行手工特征制作或采用特定启发式算法的情况下对空中运输任务进行编码和增强,通过模拟实验得出结果,表明该方法对于空中运输任务可以生成更好的接触点。
- InsertionNet 2.0: 使用多模态多视觉感知输入进行最小接触、多步插入
解决机器人快速、安全地学习插入技能的问题。提出了一种基于 InsertionNet 的方法,利用多模态输入和对比学习实现高效特征学习;引入一种关系网络方案实现了能够支持多步插入任务的一次性学习技术。该方法在 16 个真实插入任务中实现了近乎 - 一次性场景图生成
通过使用图形卷积网络和实例关系转换编码器,利用先前的关系和常识知识,提出一种用于一次性场景图生成任务的多重结构化知识方法,并且在构建的数据集上实现了历史最佳的结果。
- 属性序列的单样本学习
本文介绍了如何使用 deep learning 模型 OLAS 来解决 One-shot learning 在 attributed sequences 上的问题,并通过在真实数据集上进行实验验证了其优越性。
- ACL使用双语词典进行神经机器翻译的持续学习
该研究提出了一个评估框架,旨在评估神经机器翻译对持续学习新短语的能力,对不同的单词表示进行了单次学习方法的集成,并表明,必须解决这两个挑战才能成功使用双语词典。通过解决这两个挑战,我们能够将翻译新的、罕见的词汇和短语的能力从 30% 提高到