test accuracy | BriefGPT - AI 论文速递

关键词test accuracy

搜索结果 - 62

改变答案顺序可降低 MMLU 准确度
通过对多个子任务的测试准确率进行评估，研究了大型语言模型在多项选择问答数据集上的可靠性，提出了调整排行榜测试标准的可能性。
PDF7 days ago
长尾半监督学习中提升双重训练的一致性
通过 Boosting cOnsistency in duAl Training (BOAT) 这种新颖的简单方法，在类别分布不匹配的情况下，提高了长尾半监督学习（LTSSL）算法在各种标准的 LTSSL 基准测试中的性能和测试精度。
PDF15 days ago
ICML改进数据集简化中的伪相关性
调研发现，数据集压缩过程中原始数据集中的颜色和背景偏差会被放大，而污染偏差会被抑制；为减少偏差放大，我们提出了一种基于样本重新加权方案的简单但高效方法，实证结果显示其有效性高于最先进的去偏方法。
PDFa month ago
音乐个性化的负反馈
使用真实的负反馈作为输入和训练目标，在网络广播的下一首推荐系统中，有助于减少训练时间约 60％，并提高测试准确性约 6％；同时，添加用户跳过作为额外输入还可以显著增加用户覆盖率并略微提高准确性。
PDFa month ago
MANO：利用矩阵范数在分布偏移下进行无监督准确度估计
我们提出了一种基于 logits 的方法 MaNo，通过对 logits 进行数据依赖的归一化来减少预测偏差，并将归一化 logits 的矩阵的 Lp 范数作为评估分数，我们在多个架构上进行了广泛的实证研究并证明 MaNo 在合成、自然或亚
PDFa month ago
通过科尔莫戈洛夫 - 阿诺德表示加速理解算术运算
我们提出了新颖的方法，旨在加速在过拟合之后测试准确率的迅速增加的顿悟现象。通过关注使用 Transformer 模型学习算术二元运算中出现的顿悟现象，我们从交换二元运算的情况开始讨论数据增强，并通过科尔莫戈洛夫 - 阿诺德（KA）表示定理阐
PDFa month ago
临时时间戳分类器：分类天文预警的短序列
通过使用 Zwicky Transient Facility（ZTF）调查报告的警报，本研究提出了一种基于深度学习的天体对象分类模型。该模型通过使用每个警报中包含的戳图像和元数据以及 All-WISE 目录的特征作为输入，能够识别出三类天体
PDFa month ago
多尺度特征融合量子深度卷积神经网络用于文本分类
提出了一种基于量子卷积的全新量子神经网络模型，该模型通过引入多尺度特征融合机制和量子深度卷积来提高模型性能，并通过实验证明其在文本分类任务上优于现有量子神经网络模型，同时在使用更少参数的情况下提高了测试精度。
PDFa month ago
迁移遗忘的数据选择
深度学习模型、机器取消学习、迁移取消学习、数据筛选、测试准确率。
PDF2 months ago
基于 TabNet 的面向车辆应用的表格数据联邦学习
本文研究了如何将联邦学习应用于车辆使用案例中，目标是对道路上的障碍物、异常情况和路面类型进行分类。我们提出的框架利用了联邦学习和 TabNet，这是一种用于表格数据的先进神经网络。我们是第一个展示 TabNet 如何与联邦学习集成的研究，并
PDF2 months ago
基于条件稀疏到更稀疏方案的去中心化个性化联邦学习
提出了一种新颖的 DA-DPFL 稀疏到更稀疏的训练方案，通过动态聚合逐渐减少模型参数，从而在保留关键学习期间的足够信息的同时实现了能耗大幅降低，并在测试准确性上明显优于 DFL 基准。
PDF2 months ago
AdaGossip：分布式深度学习中的自适应共识步长与通信压缩
AdaGossip 是一种新的技术，根据相邻代理之间的压缩模型差异自适应调整共识步长，通过大量实验证明在分布式学习中具有压缩通信时，相比于当前的最先进方法，在测试准确率上实现了卓越的性能（提高了 0-2% 的测试准确率）。
PDF3 months ago
异构数据下的分布式学习均衡速率调度器
提出了平均速率调度作为减轻分散式学习中异质性影响的一种简单有效的方法，实验证明了该方法相对于采用恒定平均速率的传统方法的优越性（测试精度提高了约 3%）
PDF4 months ago
卫星群集下的机载联邦学习调度
小型卫星的超级星座已经演变成大量珍贵数据的来源。为了高效管理这些数据，本文介绍了一种适用于通过星间链路连接的卫星星座的机载联邦学习调度方案。该方案利用卫星与地面站之间的可预测可见性模式，既在个体卫星级别上，也在整个轨道上累积地，以减轻间歇性
PDF5 months ago
将泰勒级数和递归结构纳入神经网络中用于时间序列预测
本文介绍了一种新颖的神经网络架构，该架构整合了 ResNet 结构的元素，并引入了 Taylor 级数框架的创新融合。这种方法在许多基准数据集上展现出显著的测试准确性改进，并进一步通过引入递归步骤来提高测试准确性。我们的研究结果强调了我们提
PDF5 months ago
绝热量子支持向量机
我们描述了一种用于训练支持向量机的绝热量子方法，该方法的量子计算时间复杂度比经典方法好一个数量级，我们在五个基准数据集上比较了量子方法和经典方法的测试准确度，在可扩展性研究中，我们发现量子方法在具有许多特征的数据集上比经典方法快 3.5-4
PDF5 months ago
对分布变化下的无监督准确率估计进行梯度特征化
该研究论文研究了在不同测试环境中无法访问真实测试标签的情况下估计测试准确性的方法，通过使用神经网络的输出或提取特征来建立与真实测试准确性相关的估计分数，实验证明梯度提供的信息可以预测分布变化下的真实测试准确性，并提供了理论方面的洞见。
PDF6 months ago
IdentiFace：基于 VGG 的多模态人脸生物特征识别系统
IdentiFace 是一个多模式人脸生物特征系统，通过使用 VGG-16 模型和不同子系统的微小改进，将面部识别与性别、面部形状和情感等重要的软生物特征相结合，实现了五个类别的测试精度达到 99.2％，性别识别、面部形状和情感识别问题也取
PDF6 months ago
早期和晚期隐性偏见的二分法可以显然地引发 Grokking
该研究探讨在理论环境中学习算术任务中的 “理解” 现象，并表明它可以通过早期和晚期的内隐偏差引发。具体而言，当使用大初始化和小权重衰减的同质神经网络在分类和回归任务上进行训练时，我们证明训练过程会长时间陷入与核心预测器对应的解决方案，然后发
PDF7 months ago
遮挡人脸数据集生成与遮挡人脸识别
在后疫情时代，面对戴口罩给普通人脸识别带来的巨大挑战，研究人员使用预训练的 VGG16 和 ResNet50 模型提取特征，并创建了一个更具挑战性的带口罩人脸数据集，通过选择 50 个身份从 Labelled Faces in the Wi
PDF8 months ago