关键词classification problems
搜索结果 - 33
- 镜像流对可分离数据的隐性偏差
我们研究了线性可分的分类问题上,镜像流作为镜像下降的连续时间对应物。对于指数尾部损失函数和对镜像势能的适度假设,在镜像势能的限制函数方向上,我们证明了迭代会收敛到一个最大间隔分类器的 phi 无穷值。当势能是可分离的时候,一个简单的公式能够 - OTLP:使用混合整数线性规划进行输出阈值化
本研究提出了 OTLP,一个使用混合整数线性规划的阈值化框架,它在各种问题中都能提供模型不可知、支持不同目标函数和不同约束集的能力,特别适用于平衡和不平衡的分类问题。通过使用信用卡欺诈检测数据集,我们评估了该框架的实用性。
- 大型語言模型增強的機器學習分類器
利用预训练的大型语言模型 (LLM) 对经典的监督机器学习方法进行增强,以应对分类问题,并提出了几种将 LLM 集成到经典机器学习估计器中的方法,从而进一步提高预测性能。通过标准的有监督学习二分类任务和数据分布发生变化的迁移学习任务,对所提 - ResNet 训练的渐进式前馈塌陷
中间层的神经崩溃现象(NC)和渐进前向传播崩溃现象(PFC),以及它们对输入数据的依赖性扩展了对 ResNet 在分类问题中的理论理解。
- 持久分类:数据稳定性和对抗样本的新方法
提出了一个新的研究框架来研究对抗性示例,通过测量插值点与决策边界的角度,显示出对抗性示例在 MNIST 和 ImageNet 数据集的大神经网络中具有比自然示例更低的持久性,并通过开发流形对齐梯度度量与鲁棒性的联系,证明了加入这个度量时可以 - 监督学习问题的几何性质和稳定性
我们引入了一种称为风险距离(Risk distance)的监督学习问题之间的距离概念,该概念能够促进稳定性结果;通过限定这些修改可以如何改变给定问题,我们可以量化采样偏差、噪声、有限数据和近似等问题的严重性。通过建立距离,我们探索了产生的监 - 无尺寸采样核心集用于分类
通过敏感采样框架,我们对用于分类问题的核心集进一步细化和泛化。这种核心集寻求输入数据的最小可能子集,以便可以在核心集上优化损失函数,并且能够保证与原始数据的逼近保证。我们的分析提供了首个维度无关的核心集,因此大小不依赖于维度。此外,我们的结 - 类属性先验:将优化适应异质性和公平目标
现代分类问题存在类内异质性:每个类别可能具有唯一的属性,如样本大小、标签质量或可预测性(易 vs 难),以及测试时的变量重要性。我们提出了 CAP 方法,该方法根据类别属性生成特定于类别的学习策略(例如超参数),优化过程更好地适应这些异质性 - 二阶不确定性量化:基于方差的度量
在这篇论文中,我们提出了一种新的方法来使用基于方差的度量标准来量化分类问题中的不确定性,能够对类别级别的不确定性进行推理,该方法在需要细致决策的情况下非常有用。除了这种公理方法,我们还提供了实证结果,表明这种度量标准在有效性和竞争性上与常用 - 编码分类数据:除了一位有效编码,还有更热门的编码方式吗?
在一个来自 OpenML 仓库的大规模分类问题样本中,通过对实验数据拟合线性混合效应模型,我们发现在多类别任务中,独热编码和 Helmert 对比编码优于基于目标的编码器。在二分类任务中,不同的编码方案之间没有显著差异;然而,独热编码对结果 - 小样本分类问题的规范最优近似学习
小数据学习问题是响应变量观察数量有限和特征空间维度庞大之间存在显著差异,我们提出降维、分割特征空间和分类问题的高度优化近似学习算法(GOAL 算法)作为潜在解决方案,并通过实验证明其在学习性能和计算成本上优于其他当前最好的机器学习工具。
- 逆距离加权注意力
替换尺度点积注意力为负欧氏距离对网络产生了影响,简化成距离倒数加权插值;在简单单隐藏层网络上训练,使用标准交叉熵损失,倾向于生成包含原型的关键矩阵和相应逻辑回归的值矩阵;同时,我们还展示其结果可通过人工构建的原型增加特殊情况的处理能力,形成 - CLASSify: 一个用于机器学习的基于 Web 的工具
机器学习分类问题在生物信息学中很常见,但模型训练、优化和推理所需的技术知识可能阻碍研究人员利用这项技术。本文介绍了一种自动化工具,用于简化机器学习分类问题的训练模型和生成结果的过程,并提供信息丰富的可视化和对数据的洞察。该工具支持二元和多类 - 关于使用坎托罗维奇 - 鲁宾斯坦距离进行降维的研究
使用 Kantorovich-Rubinstein 距离作为分类问题中样本复杂性描述符的研究目的是利用这一事实,即 Kantorovich-Rubinstein 距离是度量空间上的度量,同时考虑底层度量空间的几何和拓扑结构。我们为每个类别的 - 基于分类的回归问题的流式主动学习
该研究提出了一种基于回归分类框架的流式主动学习方法,通过将回归问题转化为分类问题,实现了对回归问题的流式主动学习,从而在相同的注释成本下提高了回归准确性。
- 文档处理平台上类增量渐进学习的领域不可知神经架构
本文提出了一种基于专家模型混合的全可分的架构,实现了在生产环境中学习在线的高性能分类器,适用于各种领域,具有比参考方法更好的性能。
- 任务迁移学习中可迁移性的信息论方法
本文提出了一个评估跨任务表示学习有效性的 H-score 度量方式,可以对在分类问题中从一个任务传递到另一个任务的表示的性能进行评估。使用实际图像数据进行的实验表明,该评价标准不仅与经验传递度量一致,而且在源模型选择和任务转移课程学习等应用 - 强化元主动学习
该论文提出了一种基于强化学习的在线流式元主动学习方法,它从数据中直接学习信息度量,并结合模型训练来训练主动学习器,可应用于一般类别的分类问题,优于现有最先进的方法。
- 利用不相交和相邻模糊颗粒进行多类别颗粒逼近
该论文介绍了粒计算中的模糊集可以通过粒状表示集合来逼近,提出了不相交和相邻的粒子的定义,并研究了新定义对粒状逼近的影响,针对二元分类问题,利用新概念分离决策区域但尽可能覆盖属性空间;对于多类分类问题,定义了多类粒状逼近,并演示了如何高效计算 - 一种基于稀疏自编码器和灰狼优化器的数据分类框架
本文通过灰狼优化算法来训练深度自动编码器,提高在分类问题中表现的效果和性能。与其他元启发式算法相比,结果表明使用 GWO 方法能够明显提高模型表现和性能。