- 多语种答案句子选择数据集
通过使用大型语言模型,本研究提出了新的高质量数据集,用于五种欧洲语言的答案句子选择(AS2)任务,并通过多个实验证明这些数据集对于生成强大且跨语言的 AS2 模型至关重要,显著缩小了英语和其他语言之间的性能差距。
- ACL关于数据标注的高效和统计质量估计
使用置信区间寻找估计注释错误率所需的最小样本量,然后提出应用接受抽样作为错误率估计的一种替代方法,展示接受抽样可以减少最多 50% 的所需样本量,同时提供相同的统计保证。
- TIGQA:提格里尼亚语的专家标注问答数据集
使用机器翻译将现有数据集转化为 Tigrinya 数据集,构建了 TIGQA 专家注释的教育数据集,通过综合分析展示了 TIGQA 数据集需要单句和多句推理能力,使用最先进的 MRC 方法进行了实验,并与人类表现进行对比,结果强调了对 TI - 自监督的多样农业视觉任务骨干框架
通过自我监督学习从原始农业图像数据中学习有意义的特征表示,我们提出了一种利用 SimCLR 对大规模未注释数据集上进行预训练的轻量级框架,该框架具有较强的适用性,可以解决各种农业视觉任务,并降低对注释数据的依赖,从而提高成本效益和可用性,推 - 跨数据集的转移学习在资源有限的数据集中的孤立手语识别
该研究提供了一个公开的跨数据集转移学习基准,通过两个公开的土耳其手语识别数据集进行评估,使用基于时间图卷积的手语识别方法研究了五种有监督的转移学习方法,实验证明专业的有监督转移学习方法可以在闭集和部分集的数据集转移学习中获得比微调更好的性能 - 使用一系列的 GAN 生成合成图像进行行人检测
提出一种新颖的图像生成流水线,其中包括三种不同的生成对抗网络,以增加行人检测的数据集,尽管生成的图像不总是对人眼视觉上愉悦的,但我们的检测基准显示结果明显超过基准线。
- 大规模网页图像 - 文本数据集用于视觉概念理解
通过商业购物网站提供的大规模公共数据集‘Let's Go Shopping (LGS)’,我们发现现存基准数据集的分类器在电子商务数据上无法很好地进行泛化,而特定的自我监督视觉特征提取器则可以更好地进行泛化,此外,LGS 数据集的高质量电子 - 仅有少量样本的图像变化检测
这篇论文主要讨论了利用少量样本进行图像变化检测的问题,并通过使用简单的图像处理方法生成合成但具有信息量的数据集并设计了基于目标检测的早期融合网络来解决数据集不足导致的泛化能力差的问题。研究结果表明,使用合成数据训练的模型具有更好的泛化能力, - EMNLPAntarlekhaka: 多任务自然语言注释的综合工具
该研究论文介绍了 Antarlekhaka,一种用于手动注释与自然语言处理(NLP)相关任务的综合工具。该工具支持分布式注释,适用于不同语言,并具备用户友好界面和广泛的 NLP 任务注释功能。
- 医学领域的视觉问答
通过使用领域特定的预训练策略,包括一种新颖的对比学习预训练方法,解决医学视觉问答任务中数据集规模小的问题,我们的模型在 VQA-Med 2019 测试集上达到了 60% 的准确率,与其他最先进的 Med-VQA 模型具有可比性。
- FRASIMED:基于跨语言 BERT 注释投影的临床法语标注资源
通过跨语言注释投射的方法,利用一种语言不可知的基于 BERT 的方法,本研究论文介绍了一种生成翻译版本注释数据集的方法,有效增加低资源语料库的数据量,无需人力投入,只利用已有的开放数据资源。通过对跨语言注释投射方法的评估,证明了该方法的有效 - 翻译对从真实临床笔记中提取生物医学信息的影响
本研究的目的是比较使用英语工具提取和规范化翻译中的法语医学概念与使用一组已注释法语临床笔记的法语模型的表现是否相当;通过法语、英语和双语注释数据集评估算法的所有步骤(命名实体识别、规范化和翻译),结果表明本地法语方法比翻译的英语方法表现更好 - VCVW-3D:一个具有 3D 注释的虚拟建筑车辆和工人数据集
本研究创建并发布带有三维注释的虚拟数据集 VCVW-3D,该数据集涵盖了 15 个建筑场景以及 10 种建筑车辆和工人。通过对 VCVW-3D 数据集进行训练和评估,提供用于后续研究的基准。VCVW-3D 预计将通过降低数据构建、原型开发和 - EASE: 一种由效率增强机制驱动的易定制的注释系统
提供一款可定制的注释系统 ——EASE,使用多任务主动学习、基于人口统计特征的主动学习和查询大型语言模型的提示系统作为多个后端选项,可以满足自然语言处理研究人员的多样化需求,并显著加速注释过程。
- MAUPQA:大规模自动生成的波兰问答数据集
本文探讨了自动收集弱标签数据集的方法,并展示了它们对神经检索模型的性能的影响。通过本文,我们发布了 MAUPQA 数据集,其中包含接近 400,000 个波兰语问题 - 段落对,以及 HerBERT-QA 神经检索器。
- CVPR未经筛选的图像 - 文本数据集:揭示人口特征偏见
我们研究了在视觉和语言模型训练中使用大型未筛选数据集的不公平表现,以及如何应对这个问题,研究发现社会偏见在图像生成、图像描述和图像文本嵌入等视觉语言任务中都是一个持续而普遍的问题。
- FiNER: 金融命名实体识别数据集和弱监督模型
本文介绍一种用于金融领域的命名实体识别 NER 任务的高质量数据集与一个基于弱监督的框架,用于跨度级分类并提供一套公共的基准数据集,以推动金融领域研究的发展。
- AfriSenti:针对非洲语言的 Twitter 情感分析基准
本文介绍了 AfriSenti 数据集,该数据集由 14 种非洲语言的 110,000 多个推文组成,为四个语系中的 14 种非洲语言提供了 14 个情感数据集,并由母语为非洲语的人进行了注释。它用于 SemEval 2023 任务 12, - SLUE Phase-2: 一个不同语种口语理解任务的基准套件
本研究基于自由可用的语音数据介绍了几种新的语音理解测试任务,包括问题回答、摘要、命名实体定位和对话行为分类,旨在补充现有基准测试并解决 SLU 评估领域的差距,为便于比较而发布了基准模型。
- 人工语言不流畅检测,哦不,语言不流畅产生技术为大众服务
本文提出了一种名为 LARD 的方法,该方法可以从流畅的文本中自动生成人工语言障碍,并将上下文嵌入到混淆生成中以产生逼真的上下文感知人工语言障碍,从而绕过标注数据的要求。我们的实验证明 LARD 可以在没有或只有少量数据时有效地使用,并增加