- 过参数化如何影响特征?
超参数化是深度学习成功的关键因素之一,本研究通过比较不同宽度的模型的特征来探讨过参数化网络的特点,发现无论是过参数化还是欠参数化的网络都具有一些独特的特征,而过参数化网络在性能方面优于欠参数化网络,即使许多欠参数化特征被连接。在 CIFAR - 看见无形:一种以频率提示为导向的图像修复变压器
图像修复中的频率提示方法(FPro)通过从频率角度提供有效提示组件来引导修复模型,实现了优于其他方法的性能。
- 在线考试中的作弊检测和定位的多实例学习
本文介绍了一种名为 CHEESE 的多实例学习的作弊行为检测框架,结合了身体姿势、背景信息、眼神、头部姿势和面部特征等特征,在视频剪辑中分析空间和时间的变化以检测作弊行为。实验证明我们的方法有效,并在 Online Exam Proctor - 揭示二阶效应以解释预测的不确定性
可解释性人工智能为复杂的机器学习黑盒子带来了透明度,从而能够识别模型在预测中使用的特征。我们的研究揭示出预测不确定性主要由涉及单个特征或特征之间的乘积相互作用的二阶效应所主导。我们提出了一个基于这些二阶效应的预测不确定性解释方法。我们的方法 - 谨慎民主化:针对用户界面的开源自动机器学习工具中的公平特性需求
人工智能在企业和组织中的作用越来越大,对人类用户的结果和利益产生了影响。自动化机器学习(AutoML)通过自动化重复性任务和基于数据的决策,简化了机器学习模型开发过程,使非专家也能够高效地构建高质量模型。然而,AutoML 工具在处理数据、 - 类分布估计的不变性假设
我们研究了在数据集偏移下的类别分布估计问题,讨论了协变量转移、可因子化联合转移和稀疏联合转移的假设及其对类别分布估计的影响。
- 用于印地语在线手写字符识别的点、方向和方向动态特征的直方图
提出了一种与字符笔画方向和顺序变化无关的一组特征,用于在线手写字符识别。通过一种方法,将特征如点的坐标、点处笔画的方向以及点处笔画方向的动态在坐标值方面进行空间映射,并在空间图中的不同区域计算这些特征的直方图。通过训练分类器进行字符识别的其 - 使用深度生成模型的特征提取进行孟加拉文本分类新综合数据集
本研究收集、标注并准备了一个由 212,184 个孟加拉语文档组成的全面数据集,并公开提供访问。我们实施了三个深度学习生成模型:LSTM 变分自编码器(LSTM VAE)、辅助分类器生成对抗网络(AC-GAN)和对抗自编码器(AAE)以提取 - 基于原型投影的人物再识别思考
利用分类器将图像特征投影为类别原型,并将这些原型用作更有区分性的特征来进行人物 Re-ID。提出了一种新的基线模型 ProNet,在推理阶段保留分类器功能,通过分类器对特征进行投影从而学习类别原型,实验证明 ProNet 的性能显著优于之前 - ICML在图像表征中识别可解释子空间
我们提出了一种利用对比概念的自动特征解释(FALCON)的可解释性框架来解释图像表示的特征,通过使用大规模字幕数据集(如 LAION-400m)和预训练的视觉 - 语言模型(如 CLIP),FALCON 对高度活化的裁剪图像进行字幕,并得出 - 超越单一特征重要性的冰激凌
通过识别 ICECREAM 对于任何模型中的常见和罕见事件进行基于联合的解释的研究,我们提出一种信息论定量度量来衡量变量联合对目标变量分布的影响,实验结果显示 ICECREAM 在解释性和根本原因分析方面优于其他方法,并在两个任务中取得了令 - 使用非二元特征的分类器的新解释类别
研究了分类器的决策规律,提出了两种解释的方法:有支撑和对比解释。当处理非二分特征时,这些解释会受到显著影响,在此基础上,提出了一种新的完备原因的概念及其量化运算符。
- 学习者如何从文本中产生数据以分类点击诱饵
本研究是基于任务驱动面试方法,研究本科生如何使用包括文本数据在内的非结构化数据进行分类,并探究文本的特征,最终发现了三种类型的特征(功能,内容和形式),大部分在第一种情境中产生。
- 从以对象为中心的事件数据中提取和编码特征的框架
本文介绍了从对象中心事件数据中提取和编码特征的通用框架,提供了表格、序列和基于图形的编码,用于预测模型的实用性。
- 单阶段动作检测 Transformer
介绍了一种新型的一阶段行为检测变压器(OADT)模型,能够同时识别视频片段的种类和时间边界,并通过多种特征组合得到最终的 21.28%动作 mAP 测试结果,位列行为检测挑战赛第一名。
- 人类语音是否遵循本福德定律?
该研究观察到许多人造和自然数据集的前导数字频率遵循对数曲线,证明了人类语音频谱平均也遵循 Benford 定律,并使用这个观察结果来创建一组新的 speech 特征,以实现人类语音和合成语音的分类。
- CVPRTCTrack: 航空跟踪的时间上下文
本文提出了一种全面利用时间上下文进行航空追踪的框架,名为 TCTrack,该框架在特征提取和相似度图优化方面使用了时间上下文。实验表明,TCTrack 在四个航空追踪基准测试数据集上的效果令人印象深刻,并且在 NVIDIA Jetson A - 领域调整回归:ERM 可能已经学会了足以满足领域外推广的特征
本研究通过实验挑战了深度网络泛化不良的原因在于恢复 “正确” 特征失败的观点,并提出了一种新的领域调整回归(DARE)方法,该方法根据分布转移的新模型,通过域特定调整来统一一个规范潜在空间,并在该空间中学习预测。在有限环境下,该方法的收敛保 - CVPR基于粗到细的视觉问答推理
本文提出了一种新的推理框架来填补 VQA 任务中视觉特征和语义线索之间的语义鸿沟,实现了特征和谓词的有效联合学习,并在三个大规模数据集上实现了其他最先进方法无法比拟的准确度,同时还提供了一种可解释的方式来理解深度神经网络在预测答案时的决策。
- KDD电子商务盗匪地图
本文提供了一张结构化的 Bandit 算法映射图,帮助实践者通过有关奖励、行动和特征的关键决策点寻找相关实用的 Bandit 算法。