- Finer: 大规模视觉语言模型中细粒度视觉概念识别的研究与增强
最近在指导的大型视觉语言模型方面取得的进展,使得模型能够轻松生成高层次的基于图像的解释。然而,我们的工作揭示了这些模型在细粒度的视觉分类方面的缺陷,并且我们提出了一个多粒度属性为中心的评估基准,用于评估大型视觉语言模型的细粒度视觉理解能力并 - 基于正交约束和多边形面积的特征选择
本研究提出了一种新颖的正交回归模型,结合多边形的面积,以直观地捕捉特征与标签之间的区分性依赖,并采用混合非单调线性搜索方法来高效处理正交约束带来的非凸优化挑战,实验结果表明,这种方法不仅可以有效捕捉区分性依赖信息,而且在降低特征维度和提高分 - 谱聚类中特征向量的渐近高斯波动
通过对相似性矩阵的特征向量的波动性进行建模,证明了在大维空间中其元素的波动服从高斯分布,从而精确预测了谱聚类的分类性能。通过对合成数据和真实数据的数值实验,证明了这一现象的普适性。
- GraphCBAL: 基于增强学习的图神经网络类别平衡主动学习
图神经网络在最近取得了显著的成功;为了在低成本下最大化图神经网络性能,对于图神经网络的主动学习旨在从未标注的数据中查询有价值的样本进行注释,然而,大多数现有的增强式图神经网络主动学习方法可能导致高度不平衡的类分布,特别是在高度倾斜的类场景中 - ICLR人类存在即时泛化,而深度神经网络存在泛化滞后 —— 对表示分化的证据?
人类和深度神经网络在图像分类领域进行了许多行为比较的最新研究。我们报告了如何在人类观察者和各种经典和最先进的深度神经网络中获取可迁移表示的详细调查结果。发现表明,就绝对分类性能而言,深度神经网络展示了与人类学习者相媲美甚至超过的数据效率水平 - 教师到学生知识迁移的嵌入式压缩
使用可压缩的嵌入模块来改进知识蒸馏方法,以提高分类性能并增强学生模型的泛化能力。
- 基于非结构化文本的列车管理系统的层次延迟归因分类
该研究旨在使用机器学习为基于事件描述的延误归因代码分配提供决策支持,并且结果表明分层方法比平面方法更有效,但均不如手工分类。
- 类别级别微调:在带有部分标签的多标签图像分类中抵制错误的伪标签
提出了一种名为类别 - wise 微调(CFT)的新方法,旨在通过使用非伪标签对训练模型进行微调来减少由错误伪标签引起的模型不准确性,并且应用于不同方法和方案训练的模型上取得了令人瞩目的结果和普适性,成为分类模型开发的重要方法。
- 在模糊规则二元分类中应用迭代特征选择
基于模糊规则的二分类算法中,通过迭代特征选择和基于双聚类的规则挖掘,构建了一种特征选择框架,并使用自适应增强和加权平均构建了强分类器,实验结果表明该算法能取得良好的分类性能并超越同行方法。
- 基于鉴别对齐的投影信念网络用于声学事件分类:与最先进的 CNNs 相媲美
通过投影信念网络(PBN)和生成随机网络进行判别式对齐从而提高分类性能,并将隐马尔可夫模型与 PBN 结合,结果显示与先进的卷积神经网络相比,PBN-DA-HMM 能够获得可比或更好的性能,并且当与卷积神经网络结合时错误率降低了一倍。
- 多关注融合的疲劳驾驶检测模型
司机疲劳驾驶是交通事故的主要原因之一,通过引入多关注融合疲劳驾驶检测模型(MAF),可以显著提升分类性能,特别是在部分面部遮挡和低光照条件下,从而在提高算法整体稳健性方面发挥更大作用。通过在夜间和白天的光照条件下采集真实世界的数据集,我们进 - WellFactor:基于医疗数据的综合嵌入类患者画像
使用约束低秩逼近法的 WellFactor 方法,整合来自传统医疗记录和医疗网站等不同来源的数据,生成患者档案,提高分类性能、患者聚类和相似性搜索的准确性。
- 利用高辨析度的 LNT 特征增强边缘智能
采用绿色学习范式而非深度学习范式,通过无监督表示学习、监督特征学习和监督决策学习三个模块,重点研究了生成高度可辨别互补特征的一种新型监督学习方法,通过这些新特征可以提高分类性能。
- 关于组织切片级别分类神经网络的校准
深度神经网络在数字病理学中的全切片图像中预测某些生物标志物时表现出有希望的分类性能,但网络输出概率的校准经常没有得到评估。在医学环境中,通过提供可靠的置信度评分来传达不确定性具有很高的相关性。在这项工作中,我们比较了三种神经网络结构,这些结 - 关于扩散模型在合成训练数据集中的限制
通过分析真实样本复制过程中通过扩散和反向过程重建的合成样本,我们发现现代扩散模型不能完美地代表数据分布以用于训练鉴别性任务,这意味着合成数据集在分类性能上不如真实数据集。我们的研究结果表明,合成数据在增加反向步骤时集中于训练数据分布的模式, - 基于机器学习的胎儿健康数据分析分类方法
使用机器学习模型对胎儿健康进行分类分析,评估了不同模型的分类性能,并实施了降维技术以提高分类性能,其中 TabNet 模型在一个胎儿健康数据集上实现了 94.36% 的分类准确率。
- 使用基于顶点的脑皮层特征的 DenseNet 和支持向量机对主要抑郁症的分类
基于顶点特征和非线性分类器,将抑郁症患者和健康对照组区分开的研究表明,MDD 分类在这些特征和分类器的组合上是不可行的。
- 通过集合级标签增强实例级图像分类
利用集合级标签增强实例级图像分类,提高分类性能,特别在组织病理学图像分类中,相对传统单样例标签方法,实验结果显示出巨大改进并与理论分析一致,为提升图像分类模型能力提供了有前景的方法。
- 理解投影仪在知识蒸馏中的影响
在知识蒸馏过程中,我们发现即使学生和老师具有相同的特征维度,添加投影器仍然有助于提高蒸馏性能,并且投影器在体系结构中的添加甚至可以改善逻辑蒸馏。受到这些令人惊讶的发现和现有文献对知识蒸馏过程中投影器角色的不了解的启发,本文研究了被忽视的投影 - 一个使用全局字符层级和本地子单位级特征的印地语在线手写字符识别分类器
开发了一个分类器,用于模拟印地语在线手写字符的全局字符特征、子单位数量和本地子单位特征的联合分布。该分类器使用潜变量来模拟子单位的结构,使用点、方向和方向动态的直方图(HPOD)特征表示字符的全局字符级和本地子单位级,并且不依赖于字符的笔画