使用顺序输出统计的无监督序列分类

Feb, 2017

使用顺序输出统计的无监督序列分类

Unsupervised Sequence Classification using Sequential Output Statistics

Yu Liu, Jianshu Chen, Li Deng

TL;DR本文提出了一种无监督学习成本函数，应用于序列分类器中，采用随机原始 - 对偶梯度法建模并优化，实现了端到端的无标注学习，实验表明该方法与其他基线方法相比具有更高的错误纠正能力。

Abstract

We consider learning a sequence classifier without labeled data by using sequential output statistics. The problem is highly valuable since obtaining labels in training data is often costly, while the sequential output statistics (e.g., →

sequence classifier unsupervised learning stochastic primal-dual gradient method language models test errors

发现论文，激发创造

一种用于预测集合值输出的顺序集合生成方法

本文提出了一种新的机器学习框架 —— 顺序集合生成 (SSG)，可以处理标签和序列输出集。通过采用适当正则化和循环生成新标签或序列以生成完整集合，SSG 在性质上顺序不敏感且适用于各种集合输出问题，如分类标签或序列。实验结果表明，SSG 对于基准方法具有良好的性能。

Mar, 2019

可解释的序列分类：离散优化方法

本文提出了一种基于有限状态自动机的序列分类器，能够支持更早的分类并具有解释性和强大的实证表现。它具有可比较于 LSTM 的测试性能并具有可解释性的优点。

Oct, 2020

半监督序列学习

本文提出两种方法用于使用未标记的数据改善序列学习。第一种方法是预测序列中的下一个元素，第二种方法是使用序列自编码器。通过这两种算法的无监督训练，我们可以训练出更稳定且泛化性能更好的长短时记忆网络，并在诸如 IMDB、DBpedia 和 20 Newsgroups 等文本分类任务中获得强大的性能。

Nov, 2015

朝着有原则的无监督学习

该论文提出了一种新的无监督学习成本函数 (ODM)，其测量了预测分布和标签分布之间的差异，并演示了在极少量标记训练情况下，如何使用 ODM 成本进行一次领域自适应。

Nov, 2015

使用随机计算图形式化方法优化序列对序列模型

利用随机计算图形式化了一种以别名函数为损失函数的机器翻译优化问题，提供了统一的视角，可以帮助研究人员开发带有内嵌随机节点的新网络架构。

Nov, 2017

基于成对相似度和无标签数据的分类

提出了一种新的弱监督学习设置，称为 SU 分类，只需要相似数据对和未标记数据点，可以从 SU 数据中获得分类风险的无偏估计量，并证明其经验风险最小化器的估计误差达到最优参数收敛速率。通过实验证明了该方法的有效性。

Feb, 2018

顺序很重要：面向集合的序列对序列模型

本文扩展了 seq2seq 模型，实现了对输入集的合理处理以及通过搜索可能的排序来处理输出集的缺乏结构，并提出相应的解决方案，最终在多项自然语言处理任务和两项人工任务中取得了良好的结果。

Nov, 2015

非平稳环境下分类问题的自适应迁移学习视角

我们研究了一个具有非平稳标签转移的半监督分类问题，通过观察一组有标签的数据集和一系列无标签的协变量向量，我们的目标是预测每个协变量向量的相应类别标签，而无需观察除初始有标签数据集之外的真实标签。通过建立一个在任何给定测试时间内自适应地适应未知动态边缘标签概率的高概率遗憾上界，我们探索了一种基于统计方法的自适应迁移学习的替代方法，并给出了与在线学习方法相匹配的平均动态遗憾界限的界限。

May, 2024

走向神经统计学家

本文提出了一种基于变分自编码器的神经统计学习方法，通过学习一组数据集的统计信息，实现了对新数据的高效学习和分类。

Jun, 2016

自动发现和学习新的视觉类别：基于排序统计学的方法

本文针对在一个图像集合中发现新类别的问题，提出结合自监督学习、排名统计和联合目标函数优化的方法，使用带标签和未标记数据训练数据表示模型，成功应用于标准分类基准测试中，显著优于现有的方法。

Feb, 2020