通过测试时间增强来改进文本分类
通过智能测试时间增强 (TTA) 算法,在视角变化的情况下提高图像分类模型的稳健性和准确性,该方法根据预测不确定性指标智能选择最佳增强方法,并通过两个阶段的过程来实现该选择,实验验证证明这种方法可以在多个数据集和神经网络架构上获得平均准确率提高 1.73%,突出了在智能增强策略方面进一步探索的潜力。
Jun, 2024
本论文提出了一种基于学习的测试时间增强方法,通过实验分析发现了传统简单平均的不足,在进行测试时间增强时,即使使准确率有所提高,也会使许多正确的预测变为错误的预测,探讨了这种现象的原因,并在各种模型、数据集和增强方法上验证了本方法的稳定性和准确性。
Nov, 2020
机器学习模型在数据内部(ID)上表现出色,但在未见过的数据外部(OOD)输入上存在困难。本研究提出了一种名为 LLM-TTA 的技术,通过基于 LLM 生成的增强方法来改善 BERT 和 T5 模型在情感、毒性和新闻分类任务上的 OOD 鲁棒性,同时减少了生成的增强数量。该技术不受任务模型结构限制,无需 OOD 标签,在低资源和高资源环境下都有效。
Feb, 2024
Text AutoAugment 是一种数据增强方法,通过贝叶斯优化算法自动寻找最佳组合操作作为增强策略应用于训练数据。该方法显著提高了模型的泛化能力,并在六个基准数据集上表现突出,特别是在低资源和类不平衡情况下,相应的分类准确率平均分别提高了 8.8% 和 9.7%。
Sep, 2021
本文提出一种针对神经网络对未知数据的检测算法,名为 TTA-AD,借鉴了一种新的观察方法,实验证明 TTA-AD 在不同高效图像基准数据集下,运行时间比现有基于分类器的算法下降了 60%~90% 且具有可比较或更好的检测性能。
Jun, 2022
使用测试时增强作为一种关系不可知方法,通过在测试时自动增强和集成提示,来减少对提示变化的敏感性,实验结果显示了改进的模型校准性,即使用测试时增强,模型的置信度更好地反映了预测的准确性。
Oct, 2023
本研究提出了一种新的基于贝叶斯模型平均的测试时间增强(TTA)优化框架 BayTTA,通过结合模型预测并加权考虑后验概率,可以提高相关机器学习或深度学习模型的预测性能。在医学图像分析和一些流行的预训练 CNN 模型中,BayTTA 的实验结果显示可以有效地提高准确性和鲁棒性表现。
Jun, 2024
本研究探讨了 3D 点云的测试时间数据增强方法,并使用隐式表示和点云上采样技术作为系统化方法,通过从重构结果中采样点并将其用作测试时间增强数据来改进准确性。此方法对于稀疏点云的目标分类和分割等下游任务在 ModelNet40、ShapeNet、ScanObjectNN 和 SemanticKITTI 数据集上表现出更为显著的性能提升。
Nov, 2023
该研究提出了一种基于实例的测试时间数据增强方法,使用辅助模块来预测每种可能的转换的损失,并将预测损失较低的转换应用于输入,实验结果表明该方法提高了模型对多种损坏的鲁棒性。
Oct, 2020