通过测试时间增强来改进文本分类

Jun, 2022

通过测试时间增强来改进文本分类

Improved Text Classification via Test-Time Augmentation

Helen Lu, Divya Shanmugam, Harini Suresh, John Guttag

TL;DR本文提出了一种改进的测试时间增强技术并设计出相应的增强策略，结果表明用于语言模型上的测试时间增强可以显著提高模型的准确性。

Abstract

test-time augmentation -- the aggregation of predictions across transformed examples of test inputs -- is an established technique to improve the performance of image classification models. Importantly, TTA can b

test-time augmentation image classification models nlp language models augmentation policies

发现论文，激发创造

理解测试时数据增强

利用数据增强在测试期间产生平均输出的测试时间增强（TTA）是一种非常强大的启发式算法，本文旨在为 TTA 提供理论保证并澄清其行为。

Feb, 2024

智能多视图测试时间增强

通过智能测试时间增强 (TTA) 算法，在视角变化的情况下提高图像分类模型的稳健性和准确性，该方法根据预测不确定性指标智能选择最佳增强方法，并通过两个阶段的过程来实现该选择，实验验证证明这种方法可以在多个数据集和神经网络架构上获得平均准确率提高 1.73%，突出了在智能增强策略方面进一步探索的潜力。

Jun, 2024

测试时间增强中更好的聚合

本论文提出了一种基于学习的测试时间增强方法，通过实验分析发现了传统简单平均的不足，在进行测试时间增强时，即使使准确率有所提高，也会使许多正确的预测变为错误的预测，探讨了这种现象的原因，并在各种模型、数据集和增强方法上验证了本方法的稳定性和准确性。

Nov, 2020

利用上下文重写提高黑盒稳健性

机器学习模型在数据内部（ID）上表现出色，但在未见过的数据外部（OOD）输入上存在困难。本研究提出了一种名为 LLM-TTA 的技术，通过基于 LLM 生成的增强方法来改善 BERT 和 T5 模型在情感、毒性和新闻分类任务上的 OOD 鲁棒性，同时减少了生成的增强数量。该技术不受任务模型结构限制，无需 OOD 标签，在低资源和高资源环境下都有效。

Feb, 2024

Text AutoAugment: 学习文本分类的组合增强策略

Text AutoAugment 是一种数据增强方法，通过贝叶斯优化算法自动寻找最佳组合操作作为增强策略应用于训练数据。该方法显著提高了模型的泛化能力，并在六个基准数据集上表现突出，特别是在低资源和类不平衡情况下，相应的分类准确率平均分别提高了 8.8% 和 9.7%。

Sep, 2021

利用测试时间增强和一致性评估进行异常检测

本文提出一种针对神经网络对未知数据的检测算法，名为 TTA-AD，借鉴了一种新的观察方法，实验证明 TTA-AD 在不同高效图像基准数据集下，运行时间比现有基于分类器的算法下降了 60%~90% 且具有可比较或更好的检测性能。

Jun, 2022

用于事实探索的测试时增强

使用测试时增强作为一种关系不可知方法，通过在测试时自动增强和集成提示，来减少对提示变化的敏感性，实验结果显示了改进的模型校准性，即使用测试时增强，模型的置信度更好地反映了预测的准确性。

Oct, 2023

BayTTA: 使用贝叶斯模型平均优化测试时间增强的不确定性感知医学图像分类

本研究提出了一种新的基于贝叶斯模型平均的测试时间增强（TTA）优化框架 BayTTA，通过结合模型预测并加权考虑后验概率，可以提高相关机器学习或深度学习模型的预测性能。在医学图像分析和一些流行的预训练 CNN 模型中，BayTTA 的实验结果显示可以有效地提高准确性和鲁棒性表现。

Jun, 2024

三维点云分类和分割的测试时间数据增强

本研究探讨了 3D 点云的测试时间数据增强方法，并使用隐式表示和点云上采样技术作为系统化方法，通过从重构结果中采样点并将其用作测试时间增强数据来改进准确性。此方法对于稀疏点云的目标分类和分割等下游任务在 ModelNet40、ShapeNet、ScanObjectNN 和 SemanticKITTI 数据集上表现出更为显著的性能提升。

Nov, 2023

测试时间数据扩增的学习损失

该研究提出了一种基于实例的测试时间数据增强方法，使用辅助模块来预测每种可能的转换的损失，并将预测损失较低的转换应用于输入，实验结果表明该方法提高了模型对多种损坏的鲁棒性。

Oct, 2020