- 具上下文特定的贝叶斯网络分类器的改进
使用贝叶斯网络的生成分类器扩展了 TAN 和其他类型的分类器,研究了它们与贝叶斯网络之间的关系,并通过数据驱动的学习方法提高了分类准确率。
- 基于局部信息的半监督层次多标签分类器
本研究提出一种基于局部信息的半监督分层多标签分类器(SSHMC-BLI),可利用标记和未标记的数据进行训练,用于执行分层分类任务。实验结果表明,利用未标记数据可以显著提高仅基于标记数据训练的监督式分层分类器的性能。
- 基于多样功能表示的监督学习:功能投票分类器
功能数据分析(FDA)是用于建模和分析时间域函数数据的框架,在该领域中,集成学习的功能分类器只是最近引起了极大的兴趣。该论文的重点是基于功能数据的集成学习,展示了如何使用不同的功能表示来训练集成成员,并通过多数投票来组合基模型的预测结果。所 - 列表样本压缩与均匀收敛
探讨列表学习在 PAC 学习中的适用性,研究了与泛化相关的经典原理,特别侧重于一致收敛和样本压缩对于学习可行性的影响,并证明了一致收敛在列表 PAC 学习中与可学习性等价,同时发现了样本压缩的一些令人吃惊的结果。
- AAAI简单的弱核心集对于不可分解分类测量
考虑监督分类问题和非可分解评估指标,研究基于分层均匀采样的 coresets 在实证性能与理论保证方面表现优秀,特别针对 F1 得分和 Matthews 相关系数这两个广泛使用且难以优化的非可分解目标函数,证明均匀 coresets 达到了 - MiniAnDE: 一种处理微阵列数据的简化 AnDE 集成方法
该研究论文通过使用少数样本和大量变量的数据集,提出了一种用于微阵列数据的基于不同子集变量的小型异质基分类器集成算法 MinAnDE,并在实验中发现其超越了朴素贝叶斯和其他集成算法如 Bagging 和随机森林。
- 聊天机器人不可靠的文本标注工具
对比研究发现,ChatGPT 和开源语言模型在标注社会科学研究中的文本任务中表现存在显著差异,而监督分类模型一贯表现更优,因此不建议在社会科学研究中使用 ChatGPT 进行实质性的文本标注任务。
- 最小信息线性判别分析:使用无标签数据训练 LDA 模型
该论文研究了线性判别分析(LDA)方法在有限的先验信息下如何计算未标记数据的精确投影向量,并验证了该方法在适应非平稳数据方面的优势。
- 无监督表示在语音情感识别中改善有监督学习
该研究提出了一种创新的方法,通过将自我监督特征提取与监督分类相结合,从较小的音频片段中识别情感,提高了人机交互的情感理解能力。
- 通过有限族可扩展分类器的概率安全区域
通过引入概率安全区域的概念,理论上为获得的分类器提供了概率认证,通过可扩展的分类器的调整与误差控制相联系,验证了该方法的有效性。
- 不平衡分类和强化学习探索的范围损失
我们找到了强化学习问题和监督分类问题之间的等价性,并将强化学习中的探索和利用权衡问题等同于监督分类中的数据集不平衡问题,并发现它们在解决方法上的相似之处。根据我们对这些问题的分析,我们得出了一种新的强化学习和监督分类的损失函数 ——Scop - 聚合观测分类的通用无偏方法
该论文提出了一种新的通用的 CFAO 方法,通过为分类器学习提供纯净的监督并使用无偏风险估计器来保证风险的一致性,从而克服了先前研究中的问题。
- 双重贝叶斯 ResNet:心脏杂音检测的深度学习方法
该研究介绍了尝试通过使用大量记录的心音监测数据,利用双重贝叶斯 ResNet(DBRes)模型进行自动检测心脏杂音和其他听诊器所需的特定未知指标的方法。
- 处理 BERT 文本分类中的现实标签噪声
本文研究了标签噪声对 BERT 在监督分类任务中的影响,发现现实标签噪声可以严重降低 BERT 的分类性能,探讨了如何使用集成方法和噪声清洗方法来提高模型的稳健性。
- ACLLABO: 通过双层优化实现最优标签规则化学习
提出了基于优化框架的标签正则化方法。相较于传统标签平滑方法,此方法可以对每个实例进行不同的建模,通过较少的计算量和无需存储参数以及模型输出等信息,取得了在各个任务上的一致性提升。
- 基于监督、零样本和少样本的立场检测应用
本文通过确定立场检测任务的定义,提供了一个通用框架,并提供了三种不同的方法来执行立场检测:监督式分类、NLI 分类器的零样本分类和上下文学习。此外,本文论述了零样本和少样本语言分类器的应用和局限性与监督分类器的不同,并通过复制 Block - 数据质量对图像分类公平性的影响
本研究探讨了在监督式分类的情况下,训练数据的质量与通过这些数据训练的模型的整体公平性之间的关系,并测量了多个图像分类数据集上多个算法的关键公平度量,同时描绘和添加数据中的噪声以及对训练集数据进行标记的不准确性与标记噪声之间的关系。
- CVPR深度神经网络在三维泛化中的特性探究
本文旨在研究和描述深度学习模型对于目标在不同旋转角度下的 2D 图像是否能够进行准确分类,探讨了三种通用的模型 (3D 通用、纯 2D 匹配和基于视角线性组合匹配) 在模型泛化性方面的表现,其中可以发现深度模型泛化能力强,但是其实现方式与这 - 探究数据增强在不平衡数据中的作用
本研究通过实验检验了数据增强对神经网络、支持向量机和逻辑回归模型的影响,发现它可以帮助模型更好地泛化,在处理不平衡数据分类问题时效果显著。其中一个机理是通过促进数据的差异性,使得机器学习模型能够将数据的变化与标签关联起来,从而提高了模型的泛 - 使用黑盒强化学习实现分类树的最佳可解释性与性能平衡
该论文研究了一种新的 Reinforcement Learning (RL) 框架,证明了只需要解决一个完全可观测的问题就能学习到一个优化可解释性 - 性能平衡的决策树。