利用最近邻对比学习生成语音序列嵌入

Apr, 2022

利用最近邻对比学习生成语音序列嵌入

Speech Sequence Embeddings using Nearest Neighbors Contrastive Learning

Robin Algayres, Adel Nabli, Benoit Sagot, Emmanuel Dupoux

TL;DR我们介绍了一个基于自监督的音频表示的简单神经编码器架构，该架构可以使用无监督对比学习目标进行训练，并通过 k - 最近邻搜索获得它的正样本，从而可以在多个语言中应用，可用于随机语音序列的按示例查询和口头术语的发现，实验证明该方法在五种语言上显著推动了技术发展，并建立了一个基准测试以便未来监测领域的进展。

Abstract

We introduce a simple neural encoder architecture that can be trained using an unsupervised contrastive learning objective which gets its positive samples from data-augmented k-Nearest Neighbors search. We show that when built on top of recent →

neural encoder unsupervised learning self-supervised audio spoken term discovery librispeech dataset

发现论文，激发创造

声学邻居嵌入

本文提出一种新颖的声学单词嵌入，名为声学邻域嵌入，其中利用随机邻近嵌入（SNE）将任意长度的语音或文本映射到固定的、降维的向量空间中。通过训练两个编码器神经网络，它在神经网络训练中具有更有效的梯度，并在单词（名称）识别任务中显著提高了准确性，特别是在使用新的嵌入向量之间的欧几里德距离进行孤立名称识别任务时。

Jul, 2020

SNCSE: 无监督句子嵌入的对比学习与软负样本

本文通过引入软负样本和双向边缘损失来改善当前无监督对比学习中的特征抑制问题，在语义文本相似度任务上取得了最优结果。

Jan, 2022

对比学习暗中进行着随机邻居嵌入

本文探讨了无监督自学习对偶损失模型（SSCL）的理论基础，提出了在随机邻居嵌入（SNE）视角下，使用数据增强构建 “正” 偶对实现了对输入空间对比度的优化，通过与 SNE 对应，进一步提供了方法学指导并证明了使用域不可知增强与隐式偏见得到的潜在优势，同时证明了从 SNE 到 t-SNE 转换的适用性并在实验中取得了相应的优化效果。

May, 2022

利用引用嵌入的邻域对比学习科学文献表征

本文提出了一种通过对比学习来改善科学文档表示的方法 —— 使用引文图嵌入进行所控制的最近邻抽样来学习连续的相似度，内容主要涉及对比学习、科学文档表示、引文图嵌入、相似度语义以及相关研究。

Feb, 2022

用对比学习进行监督式随机近邻嵌入

在保留数据集邻近信息的范围内，我们将自监督对比方法扩展到完全监督的设置，以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起，同时将不同类别的样本集群推开。

Sep, 2023

对比学习句向量的非语言监督

本文提出了一种多模态多任务的 Transformer 模型，通过对句子和非语言数据对比学习的方式来提高句子编码器的性能，并在基准测试中获得了更高质量的语义文本相似性结果。

Sep, 2022

揭示讲话者嵌入中的情感聚类：对话音频情感识别的对比学习策略

研究表明说话者嵌入包含有关情感的有价值信息，因此在情感识别中，利用有限的标记数据，说话者嵌入有潜力成为一种有前途的资源。通过进行彻底的聚类分析，研究人员发现了情感与最先进的说话者嵌入之间的直接且有用的联系。为了利用这些信息，他们引入了一种新颖的对比预训练方法，基于说话者嵌入的类内聚类样本来进行情感无标签数据的预训练，取得了显著的情感识别性能改善。

Jan, 2024

使用监督对比学习的句子嵌入

本文提出了一种使用对比学习进行监督学习 Fine-tuning 预训练 BERT 模型以创建高效句子嵌入的新方法，相比于只使用基于交叉熵的监督学习的当前最先进方法 SBERT，我们的方法可以在句子转换和语义文本相似度基准测试上改进 2.8％和 1.05％。

Jun, 2021

使用说话人表示和自监督上下文嵌入进行口吃检测

本研究通过使用预先训练的深度学习模型提取的语音嵌入，探索了使用 ECAPA-TDNN 和 Wav2Vec2.0 模型进行口吃检测任务的音频表示。相对于仅在有限 SEP-28k 数据集上训练的标准口吃检测系统，本研究在多个传统分类器上获得了 12.08％、28.71％、37.9％的相对改进并进一步证明结合两个嵌入和连接多个层的 Wav2Vec2.0 可进一步提高其性能。

Jun, 2023

邻域增强的监督对比学习在协同过滤中的应用

我们提出的 Neighborhood-Enhanced Supervised Contrastive Loss (NESCL) 模型在三个真实数据集上， Yelp2018、Gowalla 和 Amazon-Book，相较于原始的 SGL 模型，在 NDCG@20 上分别提升了 10.09%、7.09% 和 35.36%。

Feb, 2024