- 一个使用全局字符层级和本地子单位级特征的印地语在线手写字符识别分类器
开发了一个分类器,用于模拟印地语在线手写字符的全局字符特征、子单位数量和本地子单位特征的联合分布。该分类器使用潜变量来模拟子单位的结构,使用点、方向和方向动态的直方图(HPOD)特征表示字符的全局字符级和本地子单位级,并且不依赖于字符的笔画 - 利用数据中心人工智能重塑合成表格数据生成:一项全面的基准评估
利用数据中心人工智能技术生成代表性的合成数据,以改进传统的合成数据生成方法,并促进其在提高合成数据质量和效果方面的应用。
- ELM 岭回归增强
通过提出一种 Boosting 方法来改进极限学习机(ELM)的分类性能和鲁棒性的岭回归(RR)方法。
- 词曲创作者熵对词曲创作者分类性能的影响
通过观察歌词作家与歌手的关联性,研究表明歌词 - 作家分类表现与歌词作家与歌手的关系密切相关,而在与歌手关联度最低的组别中,获得了最佳的 F1 得分,这提示进一步分析对于提取歌词作家特征的任务可能会提高歌词 - 作家分类表现。
- 使用激活色调损失对深度 CNN 层进行上色
该论文提出了一种新的色调类似的角度参数来模型化深度卷积神经网络(CNN)激活空间的结构,称为激活色调,以实现更有效的学习的目的。通过对预训练网络的激活向量进行最近邻索引的一系列观察表明,类别信息激活在图像平面上的角度 θ 以及多通道激活空间 - 使用角 Minkowski $p$- 距离分类令牌频率
使用适当的 p 值,角度闵可夫斯基 p 距离可以比传统的余弦不相似性得到更高的分类性能。
- 集成和迁移学习在一种端到端自动彩色图像检测模型中的应用
该论文提出了一种结合迁移学习和集成学习方法的新颖方法,以减少训练时间和资源需求,并提出了一个模型来对自然彩色图像和计算机彩色图像进行分类。该模型利用预训练的 VGG16 和 Resnet50 分支,以及 MobileNet v2 或 Eff - 多标签噪声转移矩阵估计与标签相关性:理论与算法
本文研究了噪声多标签学习中类相关的转换矩阵的可辨识性,并提出了一种新的估计器,该估计器利用标签相关性而无需锚点或精确拟合噪声类后验概率。通过信息提取纯净标签相关性,并利用这些事件概率暗示的标签相关性的差异,证明了转换矩阵的可辨识性,并通过解 - 利用随机分割函数生成层次结构,提升时间序列分类效果
本研究介绍了一种新颖的带有随机分割函数的层次分割聚类方法,通过层次分类(HC)增强多类数据集中的分类性能。该方法具有在不需要显式信息的情况下生成层次结构的独特能力,适用于缺乏先验层次知识的数据集。通过根据分类器的可辨识性将类别系统地分成两个 - 多标签 Takagi-Sugeno-Kang 模糊系统
提出了一种名为多标签 Takagi-Sugeno-Kang 模糊系统(ML-TSK FS)的新的多标签分类方法,通过使用模糊规则设计了 ML-TSK FS 的结构来建模特征和标签之间的关系,并通过集成基于模糊推理的多标签相关学习和多标签回归 - 基于可靠性的在多模式生物医学数据挖掘中的归纳拟合预测的噪声训练标签清理
我们提出了一种基于可靠性的训练数据清洗方法,利用归纳性依从预测 (ICP) 计算的可靠性度量来纠正大量嘈杂的训练数据中的标签错误和异常值,验证了该方法在三个分类任务中的有效性,显示出显著的分类性能提升,无需过多精心策划的训练数据。
- ACL利用潜在语义树解释情感组合
情感分析的关键,情感组合,通过对其包含的子元素的分类和对它们进行的规则操作进行分类。我们提出了语义树,一种能够以一种原则性方式解释情感组合的新树形式。语义树是上下文无关语法 (CFG) 的派生物,描述了不同语义角色的特定组合规则,这些规则是 - 多模态学习的深度度量损失
我们介绍了一种新的多模态学习损失范式,根据模态的贡献将实例分组,以防止过拟合引起的低效学习,并高效优化多模态模型,实验证明我们的损失提高了最近模型的性能。
- PDL:使用渐进丢弃层对多实例学习进行规范化
本研究提出了一种新的正则化方法,即渐进性丢失层(PDL),旨在解决弱监督学习中过拟合问题,并增强多实例学习模型在发现复杂和有影响力的特征表示方面的能力。通过在多个多实例学习方法中集成 PDL,我们在各种基准数据集上进行了广泛的评估,结果显示 - 出人意料:相似度评分的对比效应
通过提出 “惊喜得分”,一种集合标准化相似性度量方法,提高零样本和少样本文档分类任务的性能,相比原始余弦相似性,通常可以达到 10-15%的更好性能。
- 参数高效技术与完全微调之间的比较:多语言新闻文章分类案例研究
适配器和低秩适应(LoRA)是旨在使语言模型训练更加高效的参数节约微调技术。本研究通过调查这些技术在多语言文本分类任务中(流派、框架和说服技巧检测;具有不同输入长度、预测类别数量和分类难度;其中一些任务数据有限)与全面微调相比,对分类性能和 - 基于迁移集成学习的深度卷积神经网络用于糖尿病视网膜病变分类
本研究采用基于两种广泛应用的预训练卷积神经网络(VGG16 和 Inception V3)的集成方法,旨在将糖尿病性视网膜病变(DR)分为五个不同的类别。通过冻结预训练模型中的部分层,使用全局平均池化层将输出特征映射转换为固定长度向量,并将 - 基于脑电信号的运动想象分类的特征重新加权
使用非侵入性脑电信号进行运动想象分类是一项重要的目标,近期的研究表明基于卷积神经网络的方法在运动想象 - 脑电分类中得到广泛应用,文章提出了一种新的特征重新加权方法,有效降低了无关信息的影响并在实验中取得了显著的分类性能提升。
- 预训练即所需:一种基于多重图谱增强 Transformer 框架的自闭症谱系障碍分类方法
利用多层图形转化神经网络(METAFormer)模型和自主预训练技术对 407 个孤独症谱系障碍(ASD)患者和 476 个对照组(TC)被试的大脑静息态功能磁共振成像数据进行分类,结果表明,该模型在分类准确性和 AUC 得分等方面优于现有 - 预先训练的图像表示中伪特征的鉴别和分离
本论文旨在研究预训练表示中的错误相关性如何影响神经网络的预测性能,探索除去有关错误特征的方法,提出了线性自编码器训练方法来分离表示,并提出了两种有效的错特征去除方法,应用于编码并显著提高了最差组准确率。