ASR 中的自适应与半监督学习：对声学和语言模型的益处

Mar, 2019

ASR 中的自适应与半监督学习：对声学和语言模型的益处

Active and Semi-Supervised Learning in ASR: Benefits on the Acoustic and Language Models

Thomas Drugman, Janne Pylkkonen, Reinhard Kneser

TL;DR本篇论文旨在模拟在新的语音识别应用程序中应用主动学习（AL）和半监督训练（SST）带来的好处，研究数据选择方法对声学和语言模型（AM 和 LM）的影响。最终的仿真报告显示，与随机选择相比，AL 可以减少约 70％的转录成本，或在固定转录预算的情况下将单词错误率提高约 12.5％。

Abstract

The goal of this paper is to simulate the benefits of jointly applying active learning (AL) and semi-supervised training (SST) in a new speech recognition application. Our data selection approach relies on

active learning semi-supervised training speech recognition confidence filtering transcription cost reduction

发现论文，激发创造

基于一致性的半监督主动学习：朝着最小化标注成本

该论文提出了一种融合标注和模型训练的主动学习方法，结合半监督学习和基于一致性的样本选择度量，实现从未标注数据中选取最优数据来改善模型性能，在图像分类任务中实验结果显示出优异表现，同时探究了学习式主动学习方法的起点问题并提出了相关测量指标。

Oct, 2019

如何通过主动学习在半监督图像分类中克服确认偏倚

活跃学习和半监督学习在有限标记数据的真实世界应用中结合的潜力为在真实世界应用中使用有限标记数据进行学习的鲁棒方法提供了新的方向。

Aug, 2023

端到端自动语音识别：从受监督学习到半监督学习与现代架构

本文研究了 ResNet、时深分离卷积神经网络和变压器等半监督训练方法，在标准数据集 LibriSpeech 上，通过伪标签来利用来自 LibriVox 的额外未标记数据。研究结果表明，半监督训练可以改善所有架构和损失函数的模型，并在它们之间缩小性能差距，在标准监督学习设置下，获得了端到端声学模型的最新技术水平，并且半监督训练取得了新的绝对技术水平。此外，文章研究了利用不同数量的未标记音频的效果，并提出了几种评估未标记音频特性的方法，证明使用更多的音频进行训练能够减少对外部语言模型的依赖。

Nov, 2019

结合 X-Vectors 和贝叶斯批量主动学习：用于语音识别的两阶段主动学习流程

该研究通过强调数据为中心的人工智能方法，引入一种新的两阶段主动学习（AL）流程，用于自动语音识别（ASR），结合了无监督和监督的 AL 方法。该方法通过使用 x-vectors 聚类从未标记的语音数据中选择样本进行多样化的样本选择，从而建立了对后续监督 AL 的强大的初始数据集。与此同时，该方法还结合了专门为 ASR 开发的一种批量 AL 策略，通过使用 x-vectors 聚类实现样本多样性，并使用适应 Monte Carlo dropout 的贝叶斯 AL 方法识别出最具信息量的样本。该方法通过准确的不确定性估计，显著降低了 ASR 模型训练所需的数据量，相比竞争方法在同质、异质和 OOD 测试集上表现出优异的性能，证明了战略性样本选择和创新的贝叶斯建模在基于深度学习的 ASR 应用中可以极大地优化标记工作和数据利用。

May, 2024

协作智能编排：基于不一致融合的半监督学习和主动学习

该研究提出了一种名为 IDEAL 的算法，采用不一致性为基础的虚拟对抗积极学习方法来探索半监督学习和积极学习的潜在优势，通过数据采样和增强策略来评估未标记样本的不一致性并取得了良好的实验效果。

Jun, 2022

利用端到端自主训练的半监督自动语音识别

本文提出了一种基于端到端系统的自学习半监督自动语音识别方法，通过对无监督数据的伪标记迭代地增强有标记的数据，从而提高系统性能，实现数据增强效果，获得了 14.4% 的相对识别错误率改进。

Jan, 2020

FreeAL：大语言模型时代的无人主动学习

在大型语言模型时代，我们提出了创新的协作学习框架 FreeAL，通过与 LLMs 交互式提取和过滤任务特定知识，显著提高了 SLM 和 LLM 的零样本性能，无需人工监督。

Nov, 2023

抽象文本摘要的主动学习

本文提出了第一个基于多样性原则的主动学习查询策略来缓解抽象文本摘要中昂贵的注释成本，并分析了自学习的效果。该策略可以帮助提高 ROUGE 和一致性分数。

Jan, 2023

资源受限环境中的深度主动音频特征学习

讨论一种在生物声学应用中使用主动学习框架并结合特征提取的方法，能够有效减少数据标记的工作量，提高分类模型的效果。

Aug, 2023

基于小型数据集的神经数据 - 文本生成：在大型语言模型之上比较两种半监督学习方法的附加值

本研究探讨了半监督学习与预训练语言模型在数据生成文本方面的效果。结果表明，半监督学习方法可以增强输出质量和多样性，即使已经使用了预训练语言模型。

Jul, 2022