- ICML优化复杂绩效指标的通用在线算法
我们介绍和分析了一种通用的在线算法,适用于二元、多类和多标签分类问题中的各种复杂性能指标,该算法的更新和预测规则简单且计算效率高,无需存储任何过去的数据,而且对于凹函数和平滑度函数达到了 O (ln n/n) 的遗憾,并通过实证研究验证了所 - ICML倾斜与平均:最后一层的几何调整用于重新校准
神经网络的校准问题及权重调整算法 Tilt and Average (TNA) 的实证和理论验证
- 纹理可缩放的通用对抗干扰
通过在整个图像领域内添加约束并横向和纵向重复来填充一个具有小尺度的场景无关扰动 (UAP) 地图,我们提出了一种纹理尺度约束的 UAP 改进方法 (TSC-UAP),它可以自动产生具有类别特定局部纹理的 UAP,更容易愚弄深度模型,从而在愚 - 一种使用元启发式和深度学习方法的急性淋巴细胞白血病诊断模型
一个基于 ResNet 的特征提取器用于检测急性淋巴细胞性白血病(ALL),结合各种特征选择器和分类器,通过多种迁移学习模型提取深层特征后,利用 MLP 分类器对选定数据集中的 ALL 和 HEM 进行分类,取得了卓越的 90.71%准确性 - 超越差异:对分布偏移理论的深入研究
在分布转移理论中,通过采用不变风险最小化(IRM)类似的假设连接分布,研究源分布到目标分布的分类器,揭示了源分布数据足够准确分类目标的条件,并讨论了在这些条件不满足时,只需目标的无标签数据或标记目标数据的情况,并提供了严格的理论保证。
- 基于机器学习的安卓开源项目易受攻击代码更改预测
本文提出了一个能够有选择地触发源代码的安全审查的框架,通过作为代码审查服务中的审查机器人,该框架能够在代码更改提交到源代码存储库之前,在提交前自动请求额外的安全审查。该框架使用经过训练的分类器来识别具有漏洞的代码更改,采用多种类型的输入特征 - 分位点激活:离开单点估计以获得更好的对扭曲的泛化能力
通过将每个神经元的输出调整为其上下文分布,本文提出了量化激活(QACT)方法,该方法在简单网络中输出样本在其上下文分布中的相对分位数,以实现跨分布的更好泛化。我们验证了该方法在几个实验设置上的有效性,并将其与传统技术进行比较,结果表明我们在 - 动态特征学习与匹配用于类增量学习
在这篇论文中,我们从三个角度提出了动态特征学习和匹配(DFLM)模型,分别是引入类别权重信息和非平稳函数来调整训练过程中对内存的关注,利用 von Mises-Fisher(vMF)分类器有效建模动态特征分布并隐式学习其判别性质,以及通过最 - 公平精确性平衡下的内在公平性 - 准确性权衡
机器学习在执法、刑事司法、金融、招聘和招生等领域的日益广泛应用,确保机器学习辅助决策的公平性变得越来越关键。本文以统计学的 “平等机会” 概念为基础,研究了公平性和准确性之间的折衷。我们提出了一个新的准确性上限(适用于任何分类器),并将其作 - 增强的 BERT 嵌入用于学术出版物分类
本研究报告介绍了基于预训练语言模型的转移学习方法在学术文献分类中的运用。通过丰富数据集、使用不同的预训练语言模型,并调整超参数,研究发现 fine-tuning 预训练模型可以显著提高分类性能,其中 SPECTER2 模型效果最佳。此外,将 - 计算机断层扫描图像上的实时多器官分类
在医学影像中,我们提出了一种新方法,通过稀疏采样策略跨广泛视野进行数据选择,实时对多个器官进行分类,从而在不使用加速器的情况下生成全面分割,与现有的分割技术相比,展示了超 ior 优越的运行时潜力。
- 利用字母位置概率评估词复杂性
通过使用简单和复杂词汇的样本,研究发现字母位置概率与简单和复杂词汇之间存在强大的统计关联,并创建一个基于字母位置概率的分类器,可以以 83% 的准确率对这两类进行分类。通过对额外数据集的测试,证实了这一发现,最终建立了一个准确率为 97% - ICLRVoltaVision: 电子元件分类的迁移学习模型
本文分析了在对电子元件进行分类时,迁移学习的有效性。我们介绍了一种轻量级卷积神经网络模型 VoltaVision,并将其性能与更复杂的模型进行了比较。我们测试了从类似任务中迁移知识到目标领域是否比在一般数据集上训练的最先进模型获得更好的结果 - ACL关于大型语言模型对已知事实的臆断
大型语言模型在回答事实性问题方面很成功,但也容易产生幻觉。我们通过推理动态的角度来调查 LLMs 拥有正确回答知识却仍然出现幻觉的现象,这是以往对幻觉研究中没有涉及的领域。通过两个关键思想,我们能够进行这种分析。首先,我们识别了查询相同三元 - 基於改進的擴散映射的流形正則化分類模型
该论文提出了一种基于标签传播模型改进流形正则化的方法,通过增强扩散图算法的概率转移矩阵来描述流形上的标签传播过程,并证明了扩展的标签传播函数在足够长时间后收敛到稳定分布,成为一个可用的分类器,实验证明了该方法的优越性。
- 主动学习器的脆弱性
在针对文本分类的活跃学习技术中,选择正确的文本表示、分类器以及评估指标是至关重要的,因为不同的因素可能会导致活跃学习技术的有效性受到限制。
- 原始本能:相信你的分类器并跳过转换
使用 RAW 图像作为计算机视觉算法的直接输入,可以显著减少转换为 RGB 的计算时间,并且可以保持分类性能不变。
- COVID-19 检测中的领域适应高置信度伪标签
这篇论文概述了我们在 “计算机视觉与模式识别会议(CVPR)” 的 “医学图像分析中的领域适应、可解释性和公平性 AI(DEF-AI-MIA)” 研讨会上,参加第四届 COV19D 竞赛的提交内容。竞赛包括两个挑战,第一个是从 COV19- - 数据受限二元分类中平衡公平性与准确性
在处理敏感信息的应用程序中,数据限制可能会对机器学习(ML)分类器的可用数据施加限制,本文提出了一个框架,模拟了在四种实际情景下准确性和公平性之间的折衷,以确定在各种数据限制情况下,贝叶斯分类器的准确性受到的影响是如何的。
- 利用基类信息增强元训练的少样本学习
基于元学习框架,我们提出了一种端到端训练范式,通过整个训练集的信息与元学习训练范式相互增强,以解决少样本学习中训练成本高和性能欠佳的问题。而且,我们的框架是无模型偏见的,相比基准系统提升了约 1% 的性能。