- 结合去噪自编码器与对比学习来微调 Transformer 模型
使用大型预训练 Transformer 模型进行迁移学习任务已经成为自然语言处理(NLP)领域的主要趋势之一,本论文提出了一种三阶段技术来调整基础模型以适应分类任务。
- 设计抖动符号激活用于二值神经网络
该研究论文提出了使用多阈值的 Dithering Sign 激活函数在二进制神经网络中代替常见的二进制激活函数,实验证明它在分类任务中既能有效地保留特征细节又能保持低计算成本。
- 浅电路基础学习中的量子经典分离与噪音
我们研究了基于浅层电路的经典和量子监督学习模型之间的量子经典分离,并在有和无噪声的情况下进行了研究。我们构建了一个由无噪声的浅层量子电路定义的分类问题,并严格证明了任何有界连接性的经典神经网络需要对数深度才能以超指数小的概率正确输出。这种无 - 基于心脏时间序列的变点检测算法基准测试
该研究针对生物医学时间序列的状态变化模式与健康或疾病之间的关系,提出了一种有原则的选择特定任务的变点检测算法的方法,并在实际的心血管时间序列数据中评估了八种关键算法的性能。最终,从检测到的变点中提取特征,使用 K 近邻方法对 RBD 患者和 - 人工神经网络轨迹的动力稳定性与混沌
通过分析网络轨迹和学习过程中的动力学特性,研究了浅层神经网络在简单分类任务中的演化过程,发现不同学习速率下的动力学和轨道稳定性,这一发现与神经网络和动力学系统理论的常见智慧相对照,为动力系统理论、网络理论和机器学习之间的相互交流提供了贡献。
- 目标检测任务集成蒸馏
通过综合考虑分类和回归任务的重要性差异,在目标检测中提出了一种能够应对知识蒸馏中偏见预测问题的方法。
- 不要走极端:揭示 LLMs 在隐性仇恨言论检测中的过度敏感性和校准限制
大型语言模型在检测隐含仇恨言论和表达置信度方面存在敏感性和自信度失调的问题,需要谨慎优化模型以确保公平性。
- 置信可行集预测器
使用与所提目的相应的相合预测的方法,成功地用置信集对分类任务进行预测。
- 灵活的变分信息瓶颈:通过单次训练实现多样压缩
本研究提出了一种创新的分类任务框架,称为 Flexible Variational Information Bottleneck (FVIB),通过单一、高效的训练可以获取在所有 $eta$ 值上的最优模型,并且在校准性能方面优于其他信息 - AAAI破解 Transformer 模型:任务特定的上下文归因承诺在不进行预训练 LLM 微调的情况下提供改进的泛化能力
本研究提出了一种使用任务特定的上下文归因来维持模型的泛化能力并提高下游任务性能的框架。在实验证实中,该模型在三个数据集上展示了卓越的准确性和泛化性能。
- TurboSVM-FL:利用 SVM 集成懒惰客户端推动联合学习
本文提出了一种新颖的联邦聚合策略 TurboSVM-FL,该策略在客户端不增加计算负担的情况下,能够显著加快联邦分类任务的收敛速度,尤其适用于客户端仅为下一次全局聚合训练几个时期的情况。TurboSVM-FL 广泛利用支持向量机进行选择性聚 - 基于可解释归因和不确定性量化的双通道可靠乳腺超声图像分类
本研究针对乳腺超声图像的分类任务,研究了分类结果可靠性测量。我们提出了一个基于推理可靠性和预测可靠性评分的双通道评估框架。通过改进的特征归因算法 SP-RISA,优雅地应用人工对齐和医生一致的推理依据进行推理可靠性评估。使用不确定性量化通过 - 利用自然语言推理构建高效的通用分类器
通过自然语言推理作为通用分类任务,利用较小的 BERT 模型训练出的通用分类器在 33 个数据集上训练,有 389 种不同类别,能在零样本和少样本学习中取得更高的性能。
- 在回归任务中将变点检测和段分类统一,用于交通方式识别
使用 GPS 轨迹数据通过一种统一回归任务的方法,将旅行划分为具有监督方式的段落,并利用更多上下文信息,以高准确性和连续性得出五种交通方式的预测。
- EMNLP通过隐式分类将令人印象深刻的 LMM 生成文本识别为令牌预测
本文介绍了一种新颖的方法,用于识别可能参与文本生成的大规模语言模型(LLMs)。我们采用了一种将分类任务重新构建为下一个标记预测任务的方法,并直接微调基本语言模型来执行此任务。我们使用 Text-to-Text Transfer Trans - 最差类错误的上限界限提升
本文解决了最差类别错误率的问题,而不是针对所有类别的标准错误率。我们提出了一种提升算法,它能保证最差类别的训练错误的上限,并推导出其泛化界限。实验结果表明,在避免过拟合训练集的同时,该算法降低了最差类别的测试错误率。
- 全球级分层神经网络使用层级 Softmax
该论文提出了一个框架,在其中使用分层 softmax 来创建一个全局的分层分类器。该方法适用于任何具有类别的自然层次结构的分类任务。我们在四个文本分类数据集上展示了实证结果。在所有的数据集中,相比于在扁平分类器中使用的常规 softmax, - 利用同时节点和边预测的图神经网络实现骨椎可靠识别
用于 CT 扫描的自动椎骨定位和识别对于许多临床应用很重要,本论文提出了一种简单的流程,使用 U-Net 进行标准预测,然后使用单个图神经网络来关联和分类具有完整方向的椎骨,并通过引入包含骨体关联的脊柱枢等标记来测试我们的方法,展示了我们的 - 概率语言知识与单词级别文本增强
本文研究了基于标记级别的文本增强及概率语言知识在基于语言学评估的情境下的作用。在中英文的问题匹配分类任务中,对五种标记级别的文本增强技术进行了全面细致的实验,发现它们的效果普遍较差且概率语言知识的作用极小。
- 有限数据下社交机器学习的非渐进性能
本文研究了社交机器学习框架中的错误概率,包括独立训练阶段和在图上进行合作决策阶段。针对两种有限观测的分类任务,我们描述了分布式学习规则并相应地分析了错误概率。针对统计分类问题,我们采用几何社交学习规则进行性能分析。针对单样本分类任务,我们建