- CALICO:集成校准的自信主动学习
提出了一种称为 CALICO 的主动学习框架,通过联合训练分类器和基于能量的模型来实现自校准的置信度,进而提高分类性能。
- 自动识别多语言注册表的非限制网络
该研究探索了深度学习模型在自动识别网络文本分类(如新闻报道和讨论论坛)方面的应用,尤其是在多语言环境下,该模型通过使用新的多语言核心语料库,通过对 25 个分类目录进行层次化注释,提高了分类性能。
- 2024 年第五届 CLVISION 挑战赛冠军解决方案
我们介绍了应对第五届 CLVision 挑战赛的方法,该赛事存在传统类别增量学习之外的独特挑战,包括先前遇到的类别的循环出现以及可能包含未标记数据的分布外类别。我们的方法基于赢得子网络,为每个任务分配独立的参数空间以解决类别增量学习中的灾难 - 通过 LLM 驱动的主动学习和人工标注来增强文本分类
该研究引入了一种新的方法,将人工标注和大语言模型(LLMs)与主动学习框架结合,以在数据标注的成本效益和分类性能之间取得最佳平衡。实证结果表明,在降低数据标注成本的同时,模型准确性得到了保持或提高。
- 揭示小波的威力:一种基于小波的 Kolmogorov-Arnold 网络用于高光谱图像分类
该研究采用 Wavelet-based Kolmogorov-Arnold Network (wav-kan) 架构来进行高光谱图像分类,利用可学习的小波函数作为激活函数,实现对输入光谱特征的非线性映射,达到有效地捕捉多尺度空间和谱域模式的 - 基于人工智能的客服票分类:现状和 AutoML 实施
自动化技术在支持票据分类中的应用性测试研究表明,自动化机器学习(AutoML)可用于训练具有良好分类性能的机器学习模型(ML 模型),并填补了在不借助专业人员利用 AutoML 开发 AI 解决方案方面的研究空白,进而使该技术更容易为没有专 - KDDShapeFormer:用于多元时间序列分类的形状变换器
提出了一种新颖的 Shapelet Transformer 方法,通过包含具有类特定和通用特征的 Transformer 模块来捕捉多元时间序列的相关性并提高分类性能。对 30 个 UEA MTSC 数据集的实验结果证明,ShapeForm - 关于序回归问题阈值方法的损失函数评注
通过理论考虑和数值实验,本文研究了阈值法在阶序回归问题中的分类性能与数据分布以及一维转换学习程序之间的影响。研究发现,当目标变量在解释变量条件下的概率分布趋向于非单峰分布时,基于典型学习程序的阈值法可能表现不佳。此外,基于分段线性损失函数的 - ActiveLLM:基于大型语言模型的用于文本少样本场景的主动学习
ActiveLLM 是一种新颖的主动学习方法,通过利用诸如 GPT-4、Llama 3 和 Mistral Large 之类的大型语言模型来选择实例,显著提高了 BERT 分类器在少样本场景中的分类性能,并且可以扩展到非少样本场景,为各种学 - 一种新的伪最近邻分类方法:使用局部谐波平均距离
LMPHNN 是一种基于 KNN 算法的分类器,通过利用谐波平均距离 (HMD) 来改善分类性能,在小样本量或异常值方面具有较低的敏感性。
- CVPR基于局部标签的噪声标签学习中的噪声类后验估计
在嘈杂标签学习中,为了开发一致的分类器,估计嘈杂的类别后验概率起着基础性的作用,因为它是估计干净的类别后验概率和过渡矩阵的基础。本文提出了一种增强监督信息与部分级标签相结合的方法,鼓励模型关注和整合来自各个部分的丰富信息以更精确地学习嘈杂的 - 杂草分级的野外无人机影像数据集:蒴草数据集
研究通过使用商业无人机和计算机视觉系统,对西蒙塔纳州的草地进行航拍,训练了图像分类器以识别叶苣草的存在,并获得了 0.84 的准确率,为生态学,保护和遥感领域提供了改进叶苣草分类性能的机会。
- CVPR解释相关对象和隐私的模型
利用从图像中提取的对象来确定图像为私人图像的难度比较大。通过使用特征归属来解释这些模型的决策,我们发现人类类别和其个数是决定隐私决策的主要因素。因此,这些模型在识别包含敏感数据的私人图像、车辆所有权和互联网活动的图像,以及含有人类的公共图像 - 跨不相交样本的超光谱图像分类中的 Transformer 融合
本文介绍了一种新颖的方法:将 3D Swin Transformer 和 Spatial-spectral Transformer 的注意力机制进行融合,从而显著提高高光谱图像的分类性能。该方法不仅优化了空间和光谱信息的建模,还实现了更精确 - CLARE: 实时多模态数据中的认知负荷评估
我们提供了一个新颖的多模态 Cognitive Load Assessment 实时数据集 (CLARE),其中包含来自 24 名参与者的生理和注视数据,并以自我报告的认知负荷评分作为基准标签。数据集包括四种模态,分别是心电图 (ECG)、 - 预处理的重要性:一种用于 WSI 分类的片段搜索方法
经过预处理,全幻灯片图像对分类性能有影响,我们的研究通过分析单领域和多领域数据集上预处理参数对推断和训练的影响,并提出了一种新的基于相似性的模拟退火方法来快速调整参数以提高单领域数据的推断性能,从而在该领域的准确性从 0.512 提高到 0 - 持续学习中医学图像的公平性演变
通过使用领域特定的公平度量,我们评估了反复学习策略在医学图像分类任务中的偏差演化,发现伪标签策略具有更小的偏差,因此在考虑模型公平性的现实场景中应优先选择该策略。
- 针对任意数据维度优化量子卷积神经网络结构
该论文介绍了一个能够处理任意输入数据维度的量子卷积神经网络 (QCNN) 架构,优化了量子资源的分配,达到了优秀的分类性能,同时最小化了资源开销,为噪声和不完美情况下可靠量子计算提供了最佳解决方案。
- 一个可训练的特征提取器模块与扫视路径分类
我们提出了一个可训练的特征提取模块,用于将扫描路径转化为特征向量,并与深度神经网络一起训练,以提高分类性能。
- 入侵检测系统的分层分类:有效设计与实证分析
通过使用三级分层分类模型对各种网络攻击进行分类,我们的实证结果表明,相对于平级分类方法,分层分类方法在避免将攻击误分类为正常流量方面具有显著优势。