- 因果对照学习在时间上的反事实回归
本文提出了一种独特的时间反事实回归方法,通过强调长期预测,强调使用循环神经网络(RNN)进行长期预测,结合对比预测编码(CPC)和信息最大化(InfoMax),避免使用计算昂贵的变换器,捕捉到存在时间变化的混杂因素中的长期依赖关系,通过最大 - 离线强化学习中的结构化非稳定性数据集
当前强化学习通常受到需要大量数据来学习成功策略的限制。离线强化学习旨在通过使用由不同行为策略收集到的转换来解决这个问题。我们提出了一种基于对比预测编码的方法,该方法识别了离线数据集中的非稳定性,在训练策略时对其进行考虑,并在评估过程中进行预 - ACL自我互信息:通过自监督多任务学习和辅助互信息最大化实现高效多模式融合
通过自监督学习的方式,利用对比预测编码作为辅助技术最大化单模输入对和多模态融合结果之间的互信息,通过最大化互信息,促进多模态融合与单模态之间更好的对齐,从而提高多模态融合的性能。
- 对比差异预测编码
本文介绍了一种自适应时间差异版对比性预测编码,通过拼接不同时间序列数据的片段来减少学习未来事件预测所需的数据量,并将该方法应用于推导目标条件强化学习的离线策略算法。实验表明,与先前的强化学习方法相比,我们的方法在成功率方面取得了 2 倍的中 - 引导式对比自监督预训练在自动语音识别中的应用
本研究提出了一种名为 GCPC 的改进型 CPC 方法,可以注入先验知识并在 Tacotron2 上进行预训练,实验表明,相比于 CPC,该方法在德语,法语和英语等自动语音识别任务中均表现出更好的识别效果。
- 无监督分割和分类音素和单词的对比预测策略
本文研究了基于对比预测编码 (CPC) 的自监督学习 (SSL) 方法在音素分类和音素、单词分割方面的性能。结果表明,现有算法在分类和分割性能上存在平衡。为了弥合这种差距,我们借鉴了在分割方面较好的方法,并将多级建模方法整合到 CPC 的改 - 无监督单词分段的分段对比预测编码
本文提出了一个用于零资源语音处理的新的模型,称为分段对比预测编码,能够对音频信号的帧级和更高级别的分组进行编码,并将此模型用于音素和单词分割,结果在 TIMIT 和 Buckeye 数据集上显著优于现有方法。
- 零资源语音挑战赛 2021: 口语语言建模
该研究提出了 Zero Resource Speech Challenge 2021 语音挑战赛,要求参与者直接从音频中学习语言模型,无需任何文本或标签,并提供了一种基于对比性预测编码器、量化器和标准语言模型的管道基线系统。
- 对比预测编码用于人类活动识别
使用 Contrastive Predictive Coding(CPC)框架进行人体活动识别,通过对感应器数据流的长期时间结构的捕捉,得到极好的识别效果,适用于仅有少量标记数据的情况。
- WWW基于自监督对比性预测编码的时间序列变点检测
提出一种基于对比预测编码的自监督时间序列变点检测方法,通过在时间间隔对的嵌入表示之间学习区分对比来检测时间序列数据中趋势和属性的变化,相比于现有的五种监督和半监督方法在三个数据集上均取得了更好的性能。
- 联合掩码 CPC 和 CTC 训练用于自动语音识别
这篇论文介绍了一种利用自监督学习方法,通过单阶段训练自动语音识别模型,利用标记数据和非标记数据来训练模型,实现了对下游任务性能的直接优化,并在 Librispeech 100-hour 数据集上实现了类似于 wav2vec ~2.0 的词 - 多标签对比预测编码
本文提出了一种基于多标签分类问题的新的变分互信息估计器,能够超越对数上界且仍然是互信息的一个有效下界,该方法具有更好的互信息估计性能,在无监督表示学习中实现了实证改进,并在 13 项任务中超越了当前最先进的知识蒸馏方法。
- 数据增强在时域中对比学习语音表示
本文提出数据增强方法 WavAugment,对于改进基于 Contrastive Predictive Coding 算法的语音信号表示学习具有显著的增强效果,其中使用的时间域数据增强方法包括音高调整,加性噪声和混响。此外,时间域数据增强还 - COBRA:对比双模态表示算法
本文提出了一种新的 COBRA 框架,结合了 CPC 和 NCE 的方法,旨在在联合训练图像和文本两种情况下,保留内部类关系和外部类关系,从而生成一个强大的跨模态嵌入空间。实验证明,这种框架大大降低了模态差距,并在七个基准跨模态数据集上的四 - 无监督预训练在语言间具备良好的迁移能力
本篇研究调查了无监督预训练是否能够跨语言传输,以便自动语音识别系统(ASR)实现跨语言和多语言。研究表明,使用略加修改的对比性预测编码(CPC)预训练方式,能够提取和其他语言效果相当或甚至优于监督预训练的特征,证明了无监督方法在语言资源稀缺 - 使用深度多实例学习和对比预测编码的半监督组织学分类
本研究提出了一种基于两阶段半监督学习的方法,将自监督特征学习和正则化的注意力弱标注多实例学习相结合,应用于乳腺癌病理图片二分类任务,并通过五个随机数据集实现了当前最先进的分类性能。
- 自拍:自监督图像嵌入预训练
本文介绍了一种名为 Selfie 的预训练技术,其可以通过对图像进行掩蔽语言建模来进行图像嵌入,并且可以很好地适用于低数据情况下的 ResNet-50 图像分类器的训练。
- 利用对比性预编码实现高效数据图像识别
通过对自然信号变异性更可预测的表征重新审视并改进对比性预测编码的无监督目标,可以实现数据高效的图像识别,其特征支持 ImageNet 数据集上最先进的线性分类准确性,同时可在非线性分类中使用 2-5 倍的标签,最终,这种无监督表征大大改善了 - 基于对比预测编码特征的自动语音说话人验证
本论文介绍了基于对比性预测编码(CPC)特征的说话人验证的相关工作,重点是将 CPC 特征纳入标准的自动说话人验证系统中,并提出了相应的方法、实验和分析。同时还详细阐述了过去和最近的自动说话人验证系统工作、传统语音特征以及 CPC 背后的动 - 对比预测编码的表示学习
本研究提出了一种普适的无监督学习方法 Contrastive Predictive Coding,通过使用强大的自回归模型在潜在空间中预测未来来提取高维数据的有用表示,以此学习有用的表示并在语音,图像,文本和三维环境中的强化学习中实现了强大