- TEI2GO: 快速时态表达识别的多语言方法
本文介绍了 TEI2GO 模型,其与 HeidelTime 具有相当效果但具有显著改进的运行时间,在六种语言中支持,并在其中四种语言中取得了最新的结果,在生产环境和大规模应用中取得了重要的成果。
- 无人机油污漏油检测数据集:港口环境下无人机拍摄的分段式 RGB 图像
利用无人机进行自动化油污泄漏检测可以显著提高速度和准确性,本研究提出了一个独特的、有注释的数据集,通过使用卷积神经网络在台式机和边缘计算平台上分析,证明了该数据集在港口环境中对于油污检测实际应用的实用性。
- 利用深度主动学习识别公共临床笔记中的低资源运动功能信息
在临床自然语言处理研究中,功能被越来越认识到是整体个人健康的一个重要指标。我们介绍了国际功能、残疾和健康分类(ICF)中 “移动性” 领域的第一个公开注释的数据集,旨在促进从自由文本临床记录中自动提取和分析功能信息。我们使用关键词扩展来构建 - PopBERT. 在德国联邦议院中检测民粹主义及其承载意识形态
通过创建一个基于德国联邦议院演讲的标注数据集,训练一种基于变压器的模型(PopBERT)作为多标签分类器,可以可靠、有效且可扩展地测量民粹主义立场及其语言特征,从而实现对德语政治家和政党使用民粹主义语言作为战略工具的动态分析。
- AAAIMemotion 3: 代码混合 Hinglish 模因的情感分析与情绪分析概述
分析互联网上的迷因已成为一项重要的任务,因为这种多模态内容在塑造在线言论方面具有重要影响力。本文介绍了 Memotion 3 共享任务的概述,作为 AAAI-23 会议中 DeFactify 2 研讨会的一部分。该任务发布了一份基于情感(任 - 介绍 CALMED:用于自闭症儿童情绪检测的多模态注释数据集
介绍了建立一个包括自闭症儿童的多模态情感检测数据集 CALMED 的经验和方法,该数据集包括从参与者的研究会话录音文件中提取的音频和视频特征,并附有父母提供的四个目标类别的注释,共有 57,012 个示例,每个示例表示 200 毫秒(0.2 - CVPR猫鼬行为识别数据集
引入一个大型、多样化的浣熊行为识别视频数据集,包括群体社交互动、相机视野内个体的跟踪、不同光照条件等,共包括来自新西兰惠灵顿动物园的 20 个视频和 15 个未注释的视频,共计 848,400 个已注释帧。
- 知道怎么做和知道什么是 :用户手册机器阅读理解的新挑战
通过 TARA 图对用户手册进行表示,可以在各种类型问题上提高对用户手册的机器阅读理解能力,这一方法在应对复杂问题时具有巨大的潜力。
- REFinD:金融关系抽取数据集
本文提出 REFinD 数据集,该数据集为金融文档中的大规模关系注释数据集,可用于信息检索、语义搜索、问题回答和文本蕴含等任务,同时对各种最先进的深度学习模型进行实证评估并强调数据集带来的挑战。
- HalOmi: 一份手动标注的跨语言机器翻译幻觉与遗漏检测基准集
本论文发布一个注释数据集用于检测机器翻译中出现的幻觉和省略现象,并重新访问了以前的幻觉和省略检测方法,建立了新的坚实基础。
- 沙特隐私政策数据集
本研究收集并创建了一份包括来自沙特阿拉伯不同行业的个人数据保护政策的汇编,这些政策经过了根据《个人数据保护法》的 10 项原则进行的注释。最终数据集可以用于评估隐私政策合规性、制定自动化工具以监测数据保护法规遵从性的数据分析。
- ACL通过性别不明确的代词进行反事实偏见评估的计数器
本文提出了一种新的方法通过反事实生成来收集多样性,自然性和最小距离的文本对,并构建了一个由 4008 个实例分成 1002 个四重组成的 Counter-GAP 注释数据集,以评估语言模型在固指消解中的性别偏见问题。作者使用四重组级别指标解 - UzbekTagger: 一种基于规则的乌兹别克语词性标记器
本研究提出了一个低资源语言乌兹别克语的词性标注数据集和标注工具,使用一种基于规则的标注器,该标注器使用 12 种标签来标注单词的词性,通过使用前缀 / 后缀剥离方法对单词进行词干处理,该工具在乌兹别克文本中标注和识别单词的词性,并且是第一次 - EMNLPPOQue:针对个体的结果问题询问,以更深入地理解复杂事件
通过预先识别参与者,众包工人能够在语义理解的多个方面中探索并开发模型,从而收集高质量的注释数据集。
- SOLD:僧伽罗语攻击性语言数据集
本研究针对斯里兰卡使用人数超过 1700 万的 Sinhala 语,开发了一个手工注释的数据集 SOLD,和一个更大的半监督数据集 SemiSOLD,用以改进机器学习模型鉴别 Sinhala 语的具有攻击性的语言的能力。
- EMNLP强大长文摘要化还有多远?
本文通过对长文档的人工精细注释对抽象大纲概述系统进行了评估,并显示了 ROUGE 在长文档摘要内容相关性评估方面的优越性,并提出了发展事实一致性度量的方向。最后,我们发布了我们注释的长文档数据集,希望能为更广泛的概述设置开发度量做出贡献。
- ACL用 FIRE 对抗火灾:评估文本到视频检索基准的有效性
通过修正误标的负样本,我们评测了三种模型在两个标准测试集上的表现,发现在最佳模型上,修正后的指标提升了 25% 以上。此外我们发现测试集的 recall@10 已经接近饱和,同时我们推荐以样本抽样方式缓解标注数据成本,对未来的 text-t - 在网上健康建议中分类实体的方法
本文作者发布了一个新的已注释数据集 HealthE,该数据集对公共卫生相关文本的实体标签空间进行了更精细的标记,同时介绍了一个新的实体分类模型 EP S-BERT,在实体类别分类中利用了文本上下文模式。该模型的 F1 评分比最近的基线模型提 - 医疗对话中功能性段落的学习:迭代拟标记和人在循环方法
本文提出一种基于伪标签和人机协同方法的医疗对话自动分类算法,通过联合使用 bootstrap 和人机协同方法,最终在一个专家标注的数据集上将分类准确率从 69.5% 提高到 82.5%。
- ReAct: 用于行动性 (以及更多) 的评论回顾数据集
本研究介绍了一个从 OpenReview 网站中获取注释评论的数据集 ReAct,对这些评论进行了行动性和类型的众包注释。该数据集可用于评论分类等任务评估和性能分析。