human-annotated dataset | BriefGPT

关键词human-annotated dataset

搜索结果 - 5

从人类评判到预测模型：解析混合代码句子的可接受性
当前分析或生成混合代码句子的计算方法没有明确建模混合代码句子的 “自然性” 或 “可接受性”，但依赖于训练语料库来反映可接受的混合代码句子的分布。建模混合文本的可接受性可以帮助区分自然的混合文本，并实现质量控制的混合文本生成。为此，我们构建
PDF2 months ago
NaijaSenti: 面向多语种情感分析的尼日利亚推特情感语料库
介绍了首个针对尼日利亚四种最常用语言（豪萨语、伊博语、尼日利亚皮钦语、约鲁巴语）的大规模人工标注推特情感数据集，并对收集、处理和标注的方法进行了说明。同时对预训练模型和迁移策略进行了评估，并发布数据集、训练模型、情感词典和代码以促进对低资源
PDF2 years ago
EMNLP面向开放域对话代理的基本信息一致性确认
通过创建人工注释的数据集并利用 Bert 模型识别属性一致性，本文旨在提高对话代理与人类的属性一致性并进一步证明该模型有助于提高对话的一致性。
PDF4 years ago
ACL基于对话的关系抽取
本文介绍了第一个人工注释的基于对话的关系抽取（RE）数据集 DialogRE，用于支持在对话中预测两个参数之间的关系，尤其是涉及多个句子的跨句子 RE 任务，并基于分析指出演讲者相关信息在该任务中发挥了关键作用。在提出一个新的评估指标以评估
PDF4 years ago
ACL自动文章评论：任务和数据集
本文介绍了自动评论任务的提出和拥有数百万真实评论和人工标注的子集的大规模中文数据集，并开发了考虑评论质量与人类评估相关性的自动度量标准。
PDF6 years ago