baseline model | BriefGPT - AI 论文速递

关键词baseline model

搜索结果 - 16

ACL走向真实场景：不平衡的新意图发现
通过创建 ImbaNID-Bench 数据集，并提出了 ImbaNID 模型，本论文在协助探索和分类极度不平衡以及长尾分布中的用户意图方面表现出优越性，成为一种有潜力的基准模型。
PDFa month ago
少样本目标定位
该论文介绍了少样本目标定位 (Few-Shot Object Localization, FSOL) 这一新兴任务，旨在提供精确的目标位置信息。作者提出了一种创新的高性能基准模型，该模型通过整合双路径特征增强模块和自查询模块来增强形状关联和
PDF3 months ago
ROUGE-K：您的摘要是否含有关键词？
我们提出了一种关键词取向的评估指标 ——ROUGE-K，该指标通过定量回答 “摘要中是否包含关键词” 这个问题来评估自动摘要模型是否包含有信息性的单词。通过这种关键词感知的度量方法，我们令人惊讶地发现，当前的一个强基准模型在摘要中常常会遗漏
PDF4 months ago
Stellar: 人本个性化文本到图像方法的系统评估
我们系统地研究了个性化文本生成图像的问题，提出了填补文献空白的贡献，引入了新的高质量数据集和评估指标，并提出了一个简单高效的基准模型，成为了该领域的最新技术。
PDF7 months ago
EMNLPGSAP-NER: 以机器学习模型和数据集为焦点的学术实体提取的新任务、语料库和基准线
命名实体识别（NER）模型在各种自然语言处理（NLP）任务中起着关键作用，包括信息抽取（IE）和文本理解。在学术写作中，对机器学习模型和数据集的引用是各种计算机科学出版物的基本组成部分，并需要准确的模型识别。尽管 NER 取得了进展，但现有
PDF8 months ago
协作伪装对象检测：大规模数据集和基准测试
全文提供了对一项名为协作伪装目标检测（CoCOD）的新任务的全面研究，其目的是同时从一组相关图像中检测具有相同属性的伪装目标。为此，我们细致地构建了首个大规模数据集 CoCOD8K，该数据集包含 8528 张高质量且精选图像，带有目标遮罩注
PDF9 months ago
MedMNIST 分类十项赛用的复杂混频器
为解决 MedMNIST (v2) 的缺陷，本文提出了一种基于 C-Mixer 预训练框架、激励学习和自监督学习的方法，在标注空间的信息不足和不确定性问题上表现出惊人的潜力。
PDFa year ago
EMNLP印度法院裁决的命名实体识别
本文介绍了一个包含 14 种法律实体类型的 46545 个已注释的法律命名实体语料库，同时构建了一个提取法律命名实体的基准模型。
PDF2 years ago
ECCV实现高效稳健的超高清图像去莫尔纹
本文提出了一种针对超高清图像去莫尔纹的方法，首次建立了 UHDM 数据集并在其中进行了基准研究，提出了一种有效的基准模型 ESDNet，其中包括语义对齐的尺度感知模块以解决莫尔纹图案的尺度变化问题，实验证明该方法在性能和效率方面优于当前领先
PDF2 years ago
大规模时空人员再识别：算法和基准评估
本研究介绍了一个包含 10,862 个身份和超过 228k 张图片的大规模时空人员再识别数据集 (LaST)，并在其上对 14 种再识别算法进行了综合性能评估和建立了一个有效的基线模型，该模型在较短时间和换衣场景的数据集上可以很好地推广。L
PDF3 years ago
MuSe 2021 多模态情感分析挑战赛：情感、情绪、生理情感和压力
本研究通过对语音、视觉、语言和生物信号进行综合集成，聚焦于情感和情绪、生理情感和基于情感的压力识别的挑战，并介绍了包括情感识别和健康信息学在内的不同领域的社区。同时，介绍了通过本研究提供的基线模型，长短时记忆 - 递归神经网络，从使用者生成
PDF3 years ago
ACLCD2CR: 文档和领域间的共指消解
本研究提出了一个新的任务和数据集，针对异构文档类型之间的跨文档共指解析 (CD2CR)。作者发现现有的 CDCR 模型在这种跨域、跨文档的情况下表现不佳，并提供了一个优于当前 CDCR 最先进模型的基准模型。
PDF3 years ago
当前自然语言处理研究中的方法论：以 Benchmark 为目标
本文围绕语言任务与数据集的挑战性、基准模型及其改进、研究进展等方面，探讨了该领域中的研究模式与进展。
PDF4 years ago
回应《没有视觉或对话的视觉对话》（Massiceti 等，2018）
本文回应了 Massiceti 等人对 CVPR2017 Visual Dialog 论文基准模型和数据集评估提出的批评，澄清了可能会使从业者和未来参与 Visual Dialog 挑战者感到困惑的问题。
PDF5 years ago
EMNLP问题相关性排名的强基准线
通过使用机器学习方法和一种包含 14 个距离度量的简单多任务前馈神经网络，我们建立了一个性能强大、训练快速且仅使用语言无关特征的基准模型，该模型在检索先前提出的相关问题方面表现优于最佳共享任务系统。
PDF6 years ago
DRCD：一个中文机器阅读理解数据集
介绍 DRCD (Delta Reading Comprehension Dataset)，这是一个面向开放领域的传统中文机器阅读理解数据集，包含来自 2,108 个维基百科文章的 10,014 段落和超过 30,000 个问题。我们构建了
PDF6 years ago