- 接近顶峰真实数据
在生物医学领域中,由于评估机器学习模型的参考注释具有低的内部和互评可靠性,因此引入了理论概念 - PGT,该概念标志着增加参考注释的相似性不再能够转化为更好的真实世界模拟性能。提出了一种近似 PGT 的定量技术,并回顾了四类 PGT 感知策 - 反思标注:语言学习者可以做出贡献吗?
本篇论文调研了语言学习者对于数据集标注任务的适用性,通过招募 36 名英语、韩语和印尼语的语言学习者提供标注,结论是语言学习者可以通过额外的资源提供准确的标注,并且数据标注可以提高学习者的语言能力。
- ACLRedHOT: 社交媒体上注释的医疗问题、经验和声明的语料库
此研究介绍了 Reddit Health Online Talk (RedHOT),这是一个包含来自 Reddit 的 22,000 条丰富注释的社交媒体帖子,涵盖 24 种健康状况的语料库。研究人员标注了医疗声明、个人经验和问题的范围,以 - COLING移动界面实现更优语义理解
通过对 RICO 数据集进行标注并使用多模态输入,该论文提出可提高移动设备的可访问性和自动化功能以便于使用的方法,使用户能够更好地了解 UI 元素的功能,并提出了一些创新性的功能,如通过标签引用 UI 元素,提高图标的语义等,以使 UI 对 - LSDNet: 可训练的 LSD 算法实时直线段检测修改
本文介绍了一种快速、高精度的基于 CNN 的线段检测器 LSDNet,通过将一个轻量级 CNN 与传统的 LSD 检测器相结合,实现了对线段热点图和切线场构造的第一步的替代;在标准的线框图数据集上,与几种现代线段检测器相比,LSDNet 的 - ECCV大词汇手语视频的自动密集标注
本文提出了一种基于同义词和字幕 - 手语对齐的简单可扩展框架,用于自动标注手语解释电视广播中的连续手语视频,并利用标注的手语识别模型进行了假标注,从而增加已知和未知类别的标注密度。该方法可将 BOBSL BSL 手语语料库的信心自动注释数量 - 针对仇恨的多元化占据:一个基于特征的网络仇恨语料库
本研究介绍了 M-Phasis 语料库,该语料库包含了德语和法语移民相关新闻文章中近九千个用户评论,注释了 23 个特征以描述不同类型的言语(从批评性评论到隐晦和明确的仇恨表达),并训练了几个基准分类器以探索其数据特征。
- 开源 MagicData-RAMC: 一份丰富标注的普通话对话 (RAMC) 语音数据集
该研究介绍了一个高质量的、富有注释的汉语普通话会话数据集(MagicData-RAMC),包含 180 小时的汉语普通话对话录音数据,分为 15 个领域并带有主题标签,旨在丰富汉语言语社区的数据多样性,为自动语音识别、话者分离、主题检测、关 - 可以给一个例子吗?主动学习属性和关系的长尾
本文介绍了一种基于主动学习的方法,通过要求视觉场景中的属性和关系来解决目前机器学习系统训练数据不足的问题,并提出一种从数据分布长尾中获取样本的主动采样方法,证明其在视觉基因组数据集上优于传统的主动学习方法。
- CVPR自然场景中的逐实例遮挡和深度排序
本文介绍了一个名为 InstaOrder 的新数据集,其中包括 101K 个自然场景中的 2.9M 个类别标注的实例几何排序注解,包括遮挡序和深度序;此外,还提出了一种名为 InstaOrderNet 的几何排序预测网络,以及一种名为 In - ACL标注员态度:标注员信念和身份对有害语言检测的偏见
通过两项在线研究探究了评注者身份和信仰对有毒语言的评注的影响,发现评注者的身份和信仰与有毒性评分之间有很强的关联,表明对有毒语言的注释需要在社会变量中予以情境化考虑,进而提高有毒语言的注释和检测的准确性。
- 关于发布数据集中的标注者层次标签和信息
本文探讨了通过众包方式进行 NLP 数据集标注时,标注者之间的社会文化背景和个体经验差异可能导致的标签汇总引入了代表性偏差,并提高了数据集透明度和实用性的建议。
- ICLRLearn2Agree:无客观标准的多注解器拟合
提出一种名为 Learn2Agree 的学习框架,用于协调多个标注者之间的不确定性,以更好地进行医疗预测和诊断。
- CVPR部件感知全景分割
本研究提出了 Part-aware Panoptic Segmentation(PPS)这个新的场景理解任务,旨在多层次把场景理解和部件理解统一起来,并提出了一种新的评估指标,即 Part-aware Panoptic Quality(Pa - MultiWOZ 2.4: 一个包含必要注释更正的多领域任务导向对话数据集,以改进状态追踪评估
本文介绍了 MultiWOZ 2.4,它在 MultiWOZ 2.1 的验证集和测试集中改进了注释,并在此数据集上基于八个最先进的对话状态跟踪模型进行了评测,所有这些模型的表现均比 MultiWOZ 2.1 优异。
- CVPR读和参与:手语视频中的时间定位
利用 Transformer 模型,对连续的手语视频进行训练并输出 Written Tokens,从而实现手语序列中一大量手语的定位,生成大量手语词汇的注释,训练后实现 BSL-1K 标志语言识别基准测试中先前的最佳性能。
- SEP-28k:面向带口吃者的播客口吃事件检测数据集
本研究介绍了一个包含超过 28k 个剪辑的数据集,用于自动检测语言中的口吃事件,并通过将其用于声学模型的训练演示了数据集的有效性。
- CVPRD-LEMA:基于多个标注的深度学习集成 —— 应用于皮肤病变分割
本文提出了一种利用 Bayes 卷积网络处理不同标注者之间矛盾标注情况的方法, 以提高深度学习模型在多标注医学图像分割上的性能和泛化能力。
- CVPRSoccerNet-v2:广播足球视频整体理解数据集和基准
SoccerNet-v2 提出了一个大规模手动注释的语料库,其中包含大约 300k 个注释,用于扩展足球领域中的任务,以推动计算机视觉更接近于针对更广泛视频理解和制作目的的自动解决方案。
- ECCVUFO$^2$: 统一框架实现全监督物体检测
本文提出了一种名为 UFO$^2$ 的统一目标检测框架,可以同时处理不同形式的监督学习,包括强监督(如 bounding boxes)和各种形式的部分监督学习(如类别标签、点、涂鸦)和未标记数据。作者通过严格的评估表明,每种形式的标签可以用