使用顺序输出统计的无监督序列分类
本文提出了一种新的机器学习框架 —— 顺序集合生成 (SSG),可以处理标签和序列输出集。通过采用适当正则化和循环生成新标签或序列以生成完整集合,SSG 在性质上顺序不敏感且适用于各种集合输出问题,如分类标签或序列。实验结果表明,SSG 对于基准方法具有良好的性能。
Mar, 2019
本文提出了一种基于有限状态自动机的序列分类器,能够支持更早的分类并具有解释性和强大的实证表现。它具有可比较于 LSTM 的测试性能并具有可解释性的优点。
Oct, 2020
本文提出两种方法用于使用未标记的数据改善序列学习。第一种方法是预测序列中的下一个元素,第二种方法是使用序列自编码器。通过这两种算法的无监督训练,我们可以训练出更稳定且泛化性能更好的长短时记忆网络,并在诸如 IMDB、DBpedia 和 20 Newsgroups 等文本分类任务中获得强大的性能。
Nov, 2015
该论文提出了一种新的无监督学习成本函数 (ODM),其测量了预测分布和标签分布之间的差异,并演示了在极少量标记训练情况下,如何使用 ODM 成本进行一次领域自适应。
Nov, 2015
提出了一种新的弱监督学习设置,称为 SU 分类,只需要相似数据对和未标记数据点,可以从 SU 数据中获得分类风险的无偏估计量,并证明其经验风险最小化器的估计误差达到最优参数收敛速率。通过实验证明了该方法的有效性。
Feb, 2018
本文扩展了 seq2seq 模型,实现了对输入集的合理处理以及通过搜索可能的排序来处理输出集的缺乏结构,并提出相应的解决方案,最终在多项自然语言处理任务和两项人工任务中取得了良好的结果。
Nov, 2015
我们研究了一个具有非平稳标签转移的半监督分类问题,通过观察一组有标签的数据集和一系列无标签的协变量向量,我们的目标是预测每个协变量向量的相应类别标签,而无需观察除初始有标签数据集之外的真实标签。通过建立一个在任何给定测试时间内自适应地适应未知动态边缘标签概率的高概率遗憾上界,我们探索了一种基于统计方法的自适应迁移学习的替代方法,并给出了与在线学习方法相匹配的平均动态遗憾界限的界限。
May, 2024
本文针对在一个图像集合中发现新类别的问题,提出结合自监督学习、排名统计和联合目标函数优化的方法,使用带标签和未标记数据训练数据表示模型,成功应用于标准分类基准测试中,显著优于现有的方法。
Feb, 2020