- 中间预测偏置增强未见词识别
基于自条件 CTC 的无适应参数方法可以通过替换中间 CTC 预测和传递纠正标签来提高对特定术语的识别准确性,实验证明该方法成功提高了未知单词的 F1 得分。
- 一个用于稳健异常检测的 “先恢复后分类” 的框架
通过分析故障案例,揭示了当前异常检测方法未能实现更高识别准确性的原因,并提出了一种新的 Recover-then-Discriminate (ReDi) 框架,通过自动生成的特征图和选择的提示图像来解决问题,该框架在两个挑战性异常检测数据集 - 通过平衡训练数据可以减少由面部发型引起的准确性偏差吗?
面部的着装出现变化可以大大改变外貌。虽然更大的训练集可以提高对所有面部着装的识别准确率,但是由于面部着装的影响,准确率的变化不受训练集大小的影响。此外,不同人群中面部着装的分布可能导致误导人们对不同人群之间识别准确率的印象。通过分析面部着装 - 无法说不行?大型语言模型中暗黑行话的测量与推理
大型语言模型对黑暗术语和领域特定语言的理解以及其对灵敏话题的处理方法的影响进行了研究,并发现模型存在对过滤器的绕过问题和对话题的不同反应。
- 基于单幅图像的三维视角训练数据增强方法对于高效的葡萄酒标签识别的影响
为解决复杂图像识别领域中训练数据不足的关键挑战,本论文引入一种新颖的 3D 视角增强技术,专门用于葡萄酒标签识别,通过从单个真实世界的葡萄酒标签图像中生成视觉逼真的训练样本来提高深度学习模型性能,克服了文字和标识的复杂组合带来的挑战。通过扩 - TSCM: 一种利用跨度量知识蒸馏进行视觉地点识别的教师学生模型
我们提出了一种高性能的教师和轻量级学生蒸馏框架 TSCM,通过使用交叉度量知识蒸馏来缩小教师和学生模型之间的性能差距,提高识别准确度。该方法在大规模数据集上进行了全面评估,实验结果表明其在识别准确度和模型参数效率方面优于基线模型,而且我们的 - 一种用于牛脸识别的并行关注网络
野生环境下的牛脸识别在畜牧业和行为研究领域具有重要意义。该研究创建了第一个大规模的牛脸识别数据集,ICRWE,包含 483 头牛和 9,816 个高分辨率图像样本。通过采用并行注意力网络(PANet),在 ICRWE 数据集上取得了 88. - 利用 Transformer 增强物联网应用中的自动调制识别
利用 Transformer 网络为物联网应用中的自动调制识别提出了一种高效的方法,优于传统深度学习技术,实现了最高的识别准确度。
- EmMixformer: 混合变压器用于眼动识别
眼动(EM)是一种新的高度安全的生物行为模态,在近年来引起了越来越多的关注。本文提出了一种名为 EmMixformer 的混合 Transformer,用于提取眼动识别的时域和频域信息,通过学习长时间依赖关系、短时间依赖关系和全局特征,可以 - AAAI基于人工智能的能源运输安全:使用智能感知系统的管道辐射威胁估计
本论文提出了一种基于分布式光纤感应技术的能源管道径向威胁估计方法,通过利用连续多视角和多域特征融合方法提取综合信号特征构建威胁估计和识别网络,实现了对管道威胁的精细识别和定位过程,从而增强能源运输的安全性。
- 一种面向群组活动识别的因果感知模式挖掘方案
在没有隐私和可访问性问题的智能空间中,基于部署的普适传感器生成的数据流被利用来实现一种高效的群体活动识别方案,该方案从一组用户生成的普适传感器事件序列中提取因果模式,以支持与最先进的图形模型相似的识别准确性。
- 生物计量学的理论极限
生物测量学在识别准确性方面表现出了其能力。本文提出了一种理论分析方法来解决生物识别系统的可区分性问题,并展示了人口规模与避免冲突所需的独立位数之间的简单关系。研究结果令人鼓舞,因为整个地球人口的生物测量数据可以储存在一个普通硬盘上,还留有一 - 颜色模态对手写识别的影响:基于卷积神经网络的波斯语手写实证研究
通过使用卷积神经网络(CNN)作为模拟器,我们研究了手写数字和单词的彩色模态是否会影响它们的识别准确性或速度。实验结果表明,相对于其他两种彩色模态,黑白图像上的 CNN 在数字和单词的识别上具有更好的性能,而不同彩色模态下的网络精度没有显著 - 手写英文字母惯性测量单元数据集
本研究提出了一种端到端的方法来利用惯性测量单元 (IMUs) 收集数据集,以识别手写英文字母,并利用印度写作风格中存在的多样性。该研究可拓展到模式识别的领域,并为在多语言和文化背景中识别手写字母提供有价值的见解。
- 基于皮肤电反应信号特征选择与支持向量机的人类情绪识别
本论文提出了一种基于自动选择的皮肤电反应(GSR)信号特征和 SVM 的新型人类情感识别方法,使用奇异值分解特征选择方法筛选出最佳特征后,运用支持向量机实现情感识别,且识别准确率达到了 66.67% 以上。
- CVPR物体如何帮助动作识别?
本文提出了一种针对视频模型的对象引导的标记采样策略以及对象感知的注意力模块来改善识别精度,并使用较少的标记与强基线匹配,并在处理相同数量的标记时,在 SomethingElse、Something-something v2 和 Epic-K - CIT-EmotionNet: 基于 CNN 和交互式 Transformer 网络的 EEG 情感识别
本文提出了一种使用 CNN Interactive Transformer Network 的方法,将全局和局部特征有效地结合起来,以提高情感识别性能。该方法在两个公开数据集,SEED 和 SEED-IV 上表现出比现有方法更高的平均识别准 - 标准认知障碍筛查测试的自动化评估
该研究通过对 30 名患者的语音转录,对比专家手动评估和自动评估之间的相关性,探讨了半标准化病史采集后进行 SKT 和 CERAD-NB 两个标准化认知测试的效果;结果表明,使用自动化转录可以得到较高的相关性,而使用词汇替换技术可以缓解识别 - AAAI基于注意力聚合的双向互相学习手写数学表达式识别
该论文提出了一种基于双向情况下的 Attention 汇聚的互相学习网络,该网络包括一个共享编码器和两个并行解码器(逆序解码器和正序解码器),并通过互相蒸馏实现增强,同时提出了一种 Attention 汇聚模块,以有效地整合多尺度关注力,从 - MLFW:口罩人脸识别数据库
本文章研究口罩对面部识别的影响,并搭建了一个生成口罩面部的自动化工具,建立了新的 Masked LFW(MLFW)库。通过实验发现,与原始图像比较,先进的面部识别模型在 MLFW 上的识别准确率下降了 5%-16%。