- 关系预测作为改进多关系图表示的辅助训练目标
本文提出了一种新的自监督训练目标方法,通过简单地将关系预测纳入常用的 1 对所有目标中,实现了对多关系图谱表示学习的良好表述,并通过多个数据集和模型的实验表明,关系预测可以显著提高常用的 KB 完成评估任务中的实体排名效果,并在高多关系数据 - EMNLP利用下一短语预测改进文本自动完成
本文介绍了一种中间训练策略,利用新的自监督培训目标 Next Phrase Prediction(NPP),以提高预训练语言模型在文本自动完成任务中的表现,并快速适应特定领域。初步实验结果显示,我们的方法能够在电子邮件和学术写作领域的自动补 - CVPR高保真 GAN 反演用于图像属性编辑
本研究提出了一种新颖的高保真生成对抗网络(GAN)反演框架,可以进行带有图像特定细节(例如背景、外观和照明)的属性编辑,并使用扭曲一致性咨询和自适应扭曲对齐模块来提高反演和编辑质量。
- 自监督对比跨模态表示学习用于口语问答
本文提出了基于自监督和对比表示学习的新型语音问答培训方案,采用多元增广策略以及时间对齐注意来更有效地指导生成模型,实现最佳答案预测解决方案,在三个 SQA 基准测试上取得了最新成果。
- CVPRRewriteNet: 基于文本内容和风格的隐式分解实现可靠的场景文本编辑
提出了一种新的基于 RewriteNet 的场景文本编辑模型,该模型将文本图像分解为内容和样式特征,并在原始图像上重新编写文本。该模型在采用自监督培训方案的情况下在合成和实际图像上都达到了更好的生成性能。
- 基于遮挡引导的自监督三维点云场景流量估计
本文提出了一种新的自监督训练方法和架构,实现了三维场景流估计,优于传统的结构,包括多层融合技术在内的智能方法。研究结果在 Flyingthings3D 和 KITTI 数据集上均获得了监督和自监督训练的最新成果。
- ACL改变 Transformer 的思想以实现主题可控语言生成
该研究设计了一个交互式写作辅助框架,它利用基于 Transformer 的语言模型为作者提供可能的续写文本主题,并允许作者选择其中一部分以引导生成,研究表明该框架的主题选择比标准的聚类方法更好且自监督的训练能够产生流畅且相关的句子。
- ICCV使用块智能自监督神经架构搜索探索混合 CNN 转换器
本文提出了 Block-wisely Self-supervised Neural Architecture Search (BossNAS) 方法,包括定义可搜索的 CNN-transformer 混合结构搜索空间 HyTra、以及新型自 - 基于层级注意力融合的地理定位
该论文提出了一种基于层次化注意力融合网络和多尺度特征的 2D 图像检索方法,通过自监督训练控制特征强调的权重,实现了对地理定位场景的精确定位。实验结果表明,该方法优于现有的最先进方法。
- BENDR:使用变压器和对比自监督学习任务从海量脑电数据中学习
本文着眼于通过自我监督学习和适应语言建模技术来发展基于深度神经网络的脑电建模技术,建立起一个单一的预训练模型,用于建模不同硬件、不同受试者和不同任务的全新脑电图序列记录,从而取得较好的脑机接口和脑电分类性能。
- CVPR学习准确的密集对应关系及其可信度
提出了一种基于概率的方法,通过学习流场预测和不确定性,建立两幅图像间的密集对应关系,同时估计像素级置信度和可靠性,通过受限混合模型等方法建立更好的流预测和异常点建模,通过实验证明该方法在多个具有挑战性的几何匹配和光流估计数据集上具有最先进的 - 通过自监督的球形 CNN 学习定向表面
本文提出了一种基于 Spherical CNNs 的自我监督训练的方法,能够学习并识别 3D 形状的标准方向,该方法被称为 Compass,并在多个公共数据集上实验,证明了其有效性。
- EMNLPMultiCQA:基于自监督文本匹配模型的零样本迁移在大规模上的应用
研究了 140 个英文社区问答论坛上自我监督训练的文本匹配模型的零样本转移能力,并调查了其在九个答案选择和问题相似性任务的模型表现,提出了结合自我监督与监督多任务学习的最佳零样本转移模型,该模型在所有九个任务上均实现了最新的状态。
- 整体 MILC:泛化跨任务、数据集和人群学习的动态
通过一个新的自我监督训练架构,可以在功能核磁共振信号中识别出具有特异性的时空区域,从而实现精确定位和早期诊断某些精神疾病,具有比传统机器学习算法更高的分类性能。
- 迭代自监督训练的跨语言检索
本研究中,我们发现对自己的编码器输出进行挖掘,可以进一步提高多语言预训练语言模型的跨语言对齐能力;利用这一发现,我们提出了一种新方法 -- 交叉语言检索用于迭代自监督训练 (CRISS),并取得了 9 种语言方向的最新无监督机器翻译结果以及 - CVPR使用学习特征描述符的极度密集的点对应关系
本论文提出了一种有效的自监督训练方案和新的损失设计用于密集描述符学习。在对比 in-house 鼻窦内窥镜数据集和公共密集光流数据集以及小规模公共 SfM 数据集的实验中,我们证明了我们提出的密集描述符具有更好的泛化性能,显著提高了 Str - 无监督自监督训练的小样本学习
本研究提出了一种基于自监督训练(UFLST)的无监督少样本学习方法,使用渐进聚类和情节训练进行训练以进一步优化数据的特征表示,并证明了该模型在几个基准数据集中的良好性能,包括 Omniglot 和 Mini-ImageNet。
- 操纵变形线性物体的状态估计自监督学习
本文提出了一种基于状态空间表示和自我监督训练技术的视觉机器人操作方法,通过估计可变形物体状态、训练神经网络动力学模型以及采用模型预测控制器,实现高效而准确的物体操纵。
- ICCV细粒度分割网络:自监督分割以提高长期视觉定位
本文研究长期视觉定位问题,提出了 Fine-Grained Segmentation Network(FGSN)用于提供更多标签的图像分割,并能自我学习以应对季节性变化,实验证明将 FGSN 的细粒度分割整合到现有的定位算法中可显著提高定位 - 概率噪声消除:无监督内容感知去噪
本研究提出了一种名为 Probabilistic Noise2Void 的卷积神经网络训练方法,可用于单一噪声图像的去噪。通过与噪声的合适描述相结合,可以得到每个像素的噪声观测和真实信号的完整概率模型。在各种噪声情况下评估了该方法,应用于公