- 处理孟加拉语的假新闻:揭示摘要与扩充对预训练语言模型的影响
本文介绍了用摘要和增强技术以及五个预训练语言模型的四种不同方法来分类孟加拉语中的假新闻文章的方法,并通过详尽的实验和严格的评估表明,该方法在 Bengali 假新闻检测中的有效性。
- RaViTT: 随机视觉转换器标记
本文提出了一种称为 RaViTT 的随机采样策略,用于与现有 Vision Transformers 结合进行图像分类,实验结果表明,RaViTT 在 4 个数据集上都能提高准确性并击败了之前的最先进的数据增强技术。
- 密度聚类计数中的免费聚焦
该研究旨在通过引入增强方法和前景蒸馏,以提高基于图像的计数任务的性能。作者在多个数据集上展示了该方法的有效性。
- 对话系统中技能路由尾部流量鲁棒性的数据增强
研究在大规模对话系统中使用异构技能路由数据的扩充与针对长尾数据的鲁棒操作进行训练的方法,采用编码器 - 解码器生成框架来扰动原始数据字段并创建合成训练数据,通过实验结果展示了该方法的有效性。
- 基于学习的端到端 BM25 查询扩充
通过学习增强和重新加权来改进 BM25 作为信息检索基线的性能,并发现在保留速度的同时改进了其性能。此外,还发现学习到的增强和重新加权可很好地传递到未见过的数据集。
- TCN AA:一种基于 Wi-Fi 的时间卷积网络,用于带有数据增强和注意力机制的人与人之间的交互识别
提出了一种新颖的基于 TCN-AA 的方法,该方法结合增强和注意力机制,具有更高的计算效率和准确率,在公共数据集上的表现优于现有技术,最终准确率为 99.42%。
- 目标驱动的单次无监督域适应
本文提出了一种针对仅有一个无标签目标样本进行领域自适应的方法,引入了一种新颖的框架,结合数据增强、样式对齐和分类器三个模块,利用目标样本的风格来指导增强,从而在 Digits and DomainNet 基准测试上优于或与现有方法相当。
- 增强置信度图的鲁棒快速车辆检测
本文提出了一种新的方法,使用置信度图对车辆进行鲁棒且更快的检测,并引入增强概念以突出包含车辆的感兴趣区域,最终生成一个增强图。此外,本文的方法结合了粗糙集和模糊模型,证明在时间效率和检测精度方面优于现有方法。
- CLR-GAM:基于引导增强和特征映射的对比点云学习
该文章介绍了一种基于对比学习的点云数据 3D 表征自监督学习框架,该框架具有引导的增强策略和引导的特征映射,可以有效地进行动态探索和结构特征关联,并在不同下游任务上实现了最先进的性能,包括三维点云分类、少样本学习和目标部分分割。
- 增强阿拉伯目标意义验证的上下文 - 词汇增强
本文介绍了通过 (Arabic-English-Arabic) 机器回译,对 ArabGlossBERT 数据集进行了扩充。结果数据集大小增加到 352K 个对(149K 个正对和 203K 个负对)。我们使用不同的数据配置来微调目标意义验 - SelecMix: 通过对立对采样进行偏差学习
提出一种新的数据增广方法 SelecMix,旨在解决神经网络训练中数据偏差带来的问题,并在标准基准测试中证明了其有效性,尤其是在标签噪声情况下。
- TripleE: 基于剧集重播的易用领域泛化方法
本篇论文提出了 TripleE 方法,旨在扩大学习数据集,包括学习复盘和扩增方法,该方法简单易于实现,通过增强数据空间,优于其他领域泛化方法。
- ICLRAudioGen: 基于文本指导的音频生成
本文提出了一种基于文本输入生成音频的生成模型,使用数据增强技术和多流建模来减轻音频生成中的诸多挑战,包括文本注释的稀缺性、高保真音频编码和多个音频源的难以分辨等,并实现了比其他基准模型更好的音频生成效果。
- 利用选定方法改善具有弱可识别特征的小物体识别
通过使用基于 GAN 的增强方法,可以改善在 VOC Pascal 数据集上的小物体检测。实验证明,该方法可以提高小物体检测的精度,并且与其他流行的增强策略(如物体旋转和平移)相比表现更佳,基于 FasterRCNN 模型实现。
- PolarMix: 一种用于 LiDAR 点云的通用数据增强技术
PolarMix 是一种点云数据增强技术,通过两个跨扫描的增强策略实现数据的丰富和保真,能够在不同的感知任务和场景中有效缓解数据限制,并能为各种 3D 深度架构提供即插即用,并且在无监督领域适应中也表现出良好的性能。
- 遥感图像增强
本研究提出使用生成模型(GANs)为土地利用与覆盖(LULC)分类任务扩充 EuroSAT 数据集,并探索了使用 DCGAN 及 WGAN-GP 生成图像的效果,发现增加约 10%的数据集对模型性能具有改善作用。研究表明,使用 GAN 可以 - ICLR不要过度拟合历史数据 —— 递归时间序列数据增强
该论文介绍了一种递归插值方法(RIM),该方法可用于增强时间序列数据,以提高在回归、分类和强化学习任务中的性能,并通过理论分析保证了其测试性能。
- 构建大脑:子体积重组在大血管闭塞检测中的数据增强
通过使用图像增强技术和深度学习算法,针对缺乏标记的医学数据,提出了一种诊断大血管闭塞性卒中的方法,将左右半球影像进行侧面比较来预测卒中的位置。
- ICCVBiaSwap:使用定制偏差交换增强移除数据集偏见
本文提出了一种基于无监督学习和数据增强的方法,BiaSwap,用于学习去偏置特征的表示,通过样本排序和图像转换,能够生成包含去除偏置特征的图像,相比于现有的基线系统,在合成和真实数据集上都有更好的去偏置表现。
- IJCAI时间序列表示学习:基于时间和上下文对比的方法
本文提出了一种通过时间和语境对比(TS-TCC)的无监督时间序列表示学习框架,该框架可从未标记数据中学习时间序列表示,其中包括弱和强扩充转换的两个不同但相关的视图,并提出了一种新的时间对比模块和一个上下文对比模块来学习稳健的时间表示和判别性