- 强化端到端自动驾驶与潜在世界模型
我们提出了一种自我监督的方法,通过潜在世界模型来预测未来的潜在特征,从而提高无需昂贵标签的端到端驾驶性能。
- SketchTriplet: 自监督剧情化的素描 - 文本 - 图像三元组生成
本文提出了一种自监督方法用于场景素描生成,该方法不依赖于任何现有的场景素描,可将单对象的素描转化为场景素描。通过引入矢量素描字幕和素描语义扩展方法,并设计一个融合多模态感知约束的生成网络,适用于零样本图像到素描的下游任务,实验证明其具有最先 - SR4ZCT:自我监督的透平面 CT 图像任意分辨率和重叠区域增强
我们提出了一种自我监督方法 SR4ZCT,通过模拟匹配原始切片图像的训练图像,准确建模了分辨率和不同切片之间的像素间距的关系,以处理任意分辨率和重叠组合的医学 CT 图像,提高了诊断准确度。
- PoCo: 基于极坐标变换的渐进对比度学习的自监督方法
通过基于极坐标转换的渐进对比学习的自监督方法,我们提出了一种用于眼科疾病诊断的自动方法。实验结果表明,我们的方法在三个公共眼科疾病数据集上达到了最先进的性能,具有良好的泛化能力,验证了我们的方法可以减少注释工作并提供可靠的诊断。
- LiFT: 一个令人惊讶的简单轻量级特征转换用于稠密 ViT 描述符
我们提出了一种简单的自监督方法来提高 ViT 特征在密集下游任务中的性能,通过应用 LiFT 后处理网络,可以提升任何经过预训练的 ViT 主干的特征。LiFT 在自监督目标下训练快速简便,并且在最小额外推理成本下增加了 ViT 特征的密度 - WIA-LD2ND:基于小波的自监督低剂量 CT 图像对齐去噪
提出了一种仅使用 NDCT 数据的自我监督 CT 图像去噪方法 WIA-LD2ND,通过采用波尔兹曼图像对齐和频域感知多尺度损失来解决低剂量计算机断层扫描(LDCT)图像去噪问题。在两个公开的 LDCT 去噪数据集上的广泛实验表明,WIA- - LISO:纯激光雷达无监督三维物体检测
自动驾驶堆栈中,3D 物体检测是最重要的组成部分之一,但当前最先进的激光雷达物体检测器需要昂贵而缓慢的人工注释才能取得良好性能。我们引入了一种自我监督方法来训练 SOTA 激光雷达物体检测网络,该方法仅基于未标记的激光点云序列工作,我们称之 - 应用自监督学习的图神经网络对网络流量进行网络入侵检测
该研究论文基于图神经网络(GNN)提出了一种自我监督方法,用于网络入侵检测系统(NIDS)中多类别网络流的无监督学习,并通过实验验证了该方法在四个真实数据库上的良好性能。
- 大规模综合监督的跨语言开放领域问答预训练
基于自我监督方法的编码器 - 解码器模型在跨语言问答中表现出色,利用维基百科的跨语言链接结构,综合生成监督信号,提高了检索和回答生成的性能,相比于其他方法,包括机器翻译,CLASS 方法在监督和零资源语言适配等方面均取得更好的效果。
- 基于多视图自监督学习和两阶段预训练的甲状腺超声诊断改进
用有限的手动标签,通过多视角对比自监督方法以及两级预训练,提高甲状腺结节分类和分割性能,超过了 ImageNet 预训练和最先进的自监督方法。
- 改进特征的语音分割和词库学习再探
我们重新审视了一种自我监督的方法,将未标记的语音分割成类似词的段落。我们从两阶段的惩罚持续时间的动态规划方法开始,进行零资源分割,而无需学习明确的词汇表。在第一阶段的声学单元发现阶段,我们用 HuBERT 替换对比预测编码特征。在第二阶段的 - 基于集合的遮蔽粒子建模:面向自监督高能物理基础模型
提出了一种用于学习高能物理科学数据中无序输入的通用、可迁移和可重用表示的自监督方法,即掩蔽粒子建模(MPM)。通过在集合上执行基于掩蔽建模的预训练,该方法提供了一种学习置换不变函数的新方案。此外,该研究还展示了该模型的微调能力以及在新的类别 - 3D 一般物体的原始功能无监督学习
通过自我监督方法,以及使用相对方向和近距离的人物和物体点之间的关系定义的新型能力表征,我们提出了一种创新的方法来生成三维能力示例,展示了我们方法和表征的有效性。
- AAAIDHGCN:自监督点云学习的动态跳跃图卷积网络
我们提出了一种名为 DHGCN(Dynamic Hop Graph Convolution Network)的方法,通过学习点部件之间的上下文关系来提取点云中的局部特征,并利用学习到的跳跃距离作为输入进行图注意聚合,通过自我监督方法实现了最 - 低剂量计算机断层扫描重建的旋转增益噪声 2 反问题
本研究提出一种新颖的自监督方法,用于低剂量计算机断层扫描(LDCT)重构,结果表明该方法在降低剂量的情况下能够在 CT 图像质量方面取得更好的效果。
- ASWT-SGNN:自适应谱小波变换自监督图神经网络
自适应谱小波变换自我监督图神经网络(ASWT-SGNN)是一种结合了图卷积网络(GCN)和比较学习优势的自监督方法,用于学习节点表示,通过近似滤波函数和优化小波来实现灵活的邻域信息聚合和局部与全局信息之间的控制转换。
- 光流反向传播的自监督运动放大
本文介绍了一种简单的自监督方法,用于放大视频中微小的运动:给定输入视频和放大因子,我们通过操作视频,使其新的光流按所需比例缩放。我们提出了一个损失函数来训练我们的模型,该函数估计生成视频的光流并惩罚其与给定放大因子的偏差程度。因此,训练涉及 - 面向可扩展的三维异常检测和定位:通过三维异常合成和自我监督学习网络的基准测试
为了解决现有模型的可扩展性问题,本文提出了一种基于现有大规模 3D 模型的 3D 异常合成流程,以适应 3D 异常检测。同时,为了实现可扩展的 3D 异常定位表示学习,本文提出了一种自我监督方法 —— 迭代掩蔽重建网络(IMRNet),并在 - 多实体视频 Transformer 用于细粒度视频表示学习
通过重新审视变形器结构来改进视频表示学习领域的状态,利用多实体视频变换器架构及自我监督方法实现了在多个细粒度视频基准上的最先进结果。
- 自监督的土地覆盖分割方法
通过自我监督方法和深度学习,在没有高质量地面真实标签的情况下,可实现对高分辨率土地利用 / 土地覆盖变化图的自动标注,准确率达到约 52%。