baseline models | BriefGPT - AI 论文速递

关键词baseline models

搜索结果 - 34

EUFCC-340K：面向 GLAM 藏品元数据标注的多面向层次数据集
本研究讨论了在文化遗产领域中自动元数据注释的挑战，并介绍了一种新颖的数据集 EUFCC340K。该数据集采集自 Europeana 门户网站，包含超过 340,000 张图像，并按照材料、对象类型、学科和主题等多个维度进行组织，遵循 AAT
PDFa month ago
OpenGait: 走姿识别的全面基准研究以提高实用性
基于 OpenGait 开发的 DeepGaitV2、SkeletonGait 和 SkeletonGait++ 三个基准模型通过全面的基准研究，启示了深度步态模型的建模经验和典型步态特性的表征能力，为步态识别的进一步研究和应用提供了新的方
PDF2 months ago
E-TSL：具备基线方法的连续性教育土耳其手语数据集
这项研究引入了连续的教育土耳其手语（E-TSL）数据集，收集自第 5、6 和 8 年级的在线土耳其语课程。该数据集包含 1,410 个视频，总计近 24 小时，包括来自 11 位手语演讲者的表演。我们开发了两种基准模型来解决这些挑战：姿势到
PDF2 months ago
数学词问题求解中的上下文学习和比较评估中的数据增强
通过修改问题的文本和方程式，例如使用同义词替换、基于规则的问题替换和基于规则的问题翻转，提出几种方法进行数据增强，从而为数学问题求解程序提供更多样化的训练集，最终提高其解决各种数学问题的能力。本研究引入了一种新的上下文学习增强方法，采用 L
PDF3 months ago
使用策略优化进行作者风格迁移
通过参数高效的迁移学习技术和策略优化方法，本研究提出了一种简单的两步调优和优化技术，用于在资源有限的情况下进行文本风格转换，并在作者转换和更大数据的本地语言风格任务中都取得了优于最先进基准模型的表现。
PDF4 months ago
MaCmS：用于情感分析的马加希混码数据集
本文介绍了用于情感分析任务的新情感数据集 MaCMS，包含马加希语 - 印地语 - 英语（MHE）混合编码语言，这是第一个用于情感分析任务的马加希语 - 印地语 - 英语混合编码数据集。此外，我们还对数据集进行了语言学分析，以了解代码混合的
PDF4 months ago
ACL通过文化价值调查在对话代理人中架起文化差异
介绍了一个具有文化角度的对话生成基准，包括从对话交流中提取文化属性的基线模型，并证明了文化价值调查对个性化和对话质量的显著影响。
PDF6 months ago
MoSECroT: 跨语言零样本迁移的静态词向量模型拼接
使用静态词向量和相对表示构建共同空间进行跨语种零 - shot 传输，虽然提出的模型在处理 MoSECroT 方面与弱基准模型相竞争，但无法与强基准模型相同的结果竞争。
PDF6 months ago
在拥挤环境中探索社交动作潜空间和人类意识以实现有效的机器人导航
本研究提出了一种新方法，通过从社交动作潜空间中学习生成机器人控制来实现社交机器人导航。该方法在社交导航度量指标（如成功率、导航时间和轨迹长度）方面取得了显著改进，同时产生更平滑（较小加速度和角度偏差）和更具预测性的轨迹。通过与基准模型在不同
PDF9 months ago
社交媒体转发数据增强的组织活动参与者预测
利用社交媒体转发活动数据增强事件参与者预测模型的学习，在两种真实环境下对训练数据以及热启动和冷启动测试情景进行综合实验，评估结果表明我们的方法在几个基准模型中始终表现优异，尤其在限定目标领域数据时。
PDF9 months ago
ACLGECTurk：用于土耳其语的语法错误校正和检测数据集
为了克服对大多数语言缺乏大量平行标注数据的问题，本研究介绍了一种灵活可扩展的合成数据生成流程，应用于土耳其语。通过复杂的转换函数，实现了 20 多个专业编辑语法和拼写规则的生成，从而得到了 13 万句高质量平行句子。使用神经机器翻译、序列标
PDF9 months ago
Languini Kitchen：计算尺度上的语言建模研究
Languini Kitchen 为研究人员提供有限计算资源以在语言建模领域有意义贡献的研究集体和代码库，通过实验协议介绍了以加速器时间为基准进行模型比较的方法；该研究还提供了两种基线模型，GPT-2 架构的前馈模型和具有 10 倍吞吐量的
PDF9 months ago
Text2KGBench：基于本体驱动的文本知识图谱生成基准
该研究论文介绍了 Text2KGBench 这个基准评估工具，可以评估语言模型的能力，从自然语言文本中生成知识图谱，并根据本体论从文本中提取事实。研究还提供了基准模型的结果和显示了使用语义网和自然语言处理技术，可以进一步提高模型性能的潜力。
PDFa year ago
应对会话式问答中的第三方修复
处理不正常交流对于鲁棒和忠实的会话型人工智能至关重要。我们收集和公开发布了 Repair-QA，这是第一个大型的用于会话型问答设置中的第三位置修复的数据集。通过训练和评估强大的基准模型来展示数据的有效性，并且结果表明，GPT-3 模型在修复
PDFa year ago
InstructIE：一个基于中文指令的信息提取数据集
该论文介绍了一种新的信息提取任务，名为 Instruction-based IE，旨在要求系统根据特定的指示或指南提取信息。作者从中文维基百科和高质量众包注释实例构造了一个名为 InstructIE 的数据集，并评估了各种基线模型在该数据集
PDFa year ago
表格学习的自强化注意力机制
本研究介绍了一种名为 SRA 的注意力机制，通过使用权重向量来学习可解释的表示，并在基准模型的端到端组合中有效应用于合成和现实世界的不平衡数据。
PDFa year ago
FrenchMedMCQA：一份针对医学领域的法语多项选择题答题数据集
该论文介绍了 FrenchMedMCQA，即用于医学领域的多项选择问答（MCQA）的首个公开数据集，其中包含从法国药学专业毕业考试中提取的 3105 个问题，使用单选和多选题混合，提供基线模型以自动处理此 MCQA 任务。
PDFa year ago
用于检测真实世界环境声明的数据集
本文介绍了一份由专家标注的数据集，用于检测上市公司所做的关于环境的宣称，并且我们使用这个数据集训练和发布了基线模型。我们进一步展望了我们的数据集可能的应用：我们使用我们的精调模型来检测 2012 年至 2020 年季度盈利电话会议的回答部分
PDF2 years ago
IJCAI基于文本数据的次年破产预测：基准和基线模型
该论文基于新型和经典数据集引入了一个无结构数据情况下的基准测试，评估了几种经典和神经基础模型，并发现基于静态领域词汇表示的轻量级词袋模型在多年的文本数据中获得了出人意料的良好结果。
PDF2 years ago
SIGIR专利短语语义匹配数据集
本研究介绍了一个新的人工评估的语境性短语匹配数据集，主要应用于专利和科学出版物中的技术概念，并且描述了该数据集和一些基线模型。
PDF2 years ago