ablation study | BriefGPT - AI 论文速递

关键词ablation study

搜索结果 - 18

Word2World: 通过大型语言模型生成故事和世界
通过 Word2World 系统，大型语言模型 (LLMs) 可以通过故事无需任何任务特定的微调，创造多样内容并提取信息，设计叙述性和以瓷砖在合适位置创建连贯世界和可玩游戏。
PDF2 months ago
无候选集下的实体链接的统一考察
通过引入一个黑盒子基准，并对所有最先进的实体链接方法进行全面评估，本文解决了近年来实体链接系统发展中缺乏统一框架的问题。研究发现实体链接系统对候选集的依赖性及其对各个系统的普适性的限制，提出了一种替代候选集的方法，并展示了某些模型在更宽松的
PDF3 months ago
ICLRTransformer 前馈层中关键值记忆更新的实证研究
通过在大型语言模型中的知识编辑和微调任务中比较更新键或值的两种方法，我们对 transformer 中的前馈网络进行了实证消融研究，从而更好地理解前馈网络作为一组键值神经存储器来恢复抽象高层知识。
PDF5 months ago
超平面：用于快速 NeRF 自适应的超网络方法
提出了一种基于超网络范例的少样本学习方法，通过从训练数据中收集信息并生成通用权重的更新，实现了从少量图像中一步生成高质量的 3D 物体表示的高效方法。通过与最先进的解决方案进行直接比较以及全面的剔除研究，证实了该方法的有效性。
PDF5 months ago
重新审视离线强化学习的极简主义方法
通过设计实验，研究离线强化学习算法中较不重要但仍影响效果的设计决策，并提出了一种集成这些设计元素的算法 ReBRAC，它在 51 个数据集上得到了最先进的表现。通过大规模实验，我们进一步证明了这些设计决策的功效。
PDFa year ago
跨模态门控注意力融合用于多模态情感分析
提出了 CMGA，即跨模态门控注意力融合模型，用于多模态情感分析，证明其在 MOSI 和 MOSEI 两个基准数据集上具有优异的性能，并展示了模型内不同组件的作用。
PDF2 years ago
KDD基于可解释人工智能的消融研究分析
针对可解释人工智能 (XAI) 方法缺乏基础事实的问题，研究人员提出了基于公理的方法，通过削弱输入属性的重要性来评估模型性能是否符合期望；本文则使用五个数据集，三种 XAI 方法，四个基线和三个扰动方案，展示了不同的扰动策略在验证过程中的作
PDF2 years ago
混搭：关于多语言文本转语音训练语料库组成的实证研究
本研究通过全面的消融研究，旨在了解训练语料库的各种因素，例如语言家族关系、性别构成和说话人数是如何对多语音合成质量的贡献的，并得出了女性说话数据在大多数情况下是首选的结论，并且并不总是从目标语言方言中拥有更多说话者对训练语料库有益，这些发现
PDF2 years ago
CVPR带有掩模指导的分层深度细化
本文提出了一种基于掩码图像的深度优化方法，该方法可以使用自监督学习技术和单张图像估计模型进行深度的有效细化，能够较好地解决单张深度估计模型在物体内外边界处存在的问题，并在真实应用中取得了良好的效果。
PDF2 years ago
ACLML_LTU 参加 SemEval-2022 任务 4：T5 向识别居高临下和轻蔑语言挑战
本研究论文描述了 LTU 机器学习小组在 SemEval-2022 任务 4 的子任务 1：亲切和傲慢语言检测中使用的系统。我们的系统包括微调预训练的 Text-to-Text-Transfer Transformer（T5）并创新性地减少
PDF2 years ago
优化 U-Net 用于脑肿瘤分割
本文通过一项消融研究，建议了优化的 U-Net 架构用于 BraTS21 挑战的脑肿瘤分割任务，并在 NVIDIA Deep Learning Examples GitHub 仓库中开源了代码来重现我们的 BraTS21 提交。
PDF3 years ago
图像场景图生成（SGG）基准测试
本研究发展了基于 maskrcnn-benchmark 和多个流行模型的场景图像生成基准测试，并通过 Visual Genome 和 OpenImages 视觉关系检测数据集的全面研究来评估场景图像生成模型的主要特性，从而为完善图像理解模型
PDF3 years ago
ACLLRG 参加 SemEval-2021 任务 4: 使用增强、语言特征和投票改进抽象词的阅读理解
本文介绍了我们在 SemEval-2021 任务 4 中的方法，使用 transformers-based 模型和词汇数据库进行阅读理解，包括用于模拟不可感知性的语言特征和用于模拟非特定性的信息，并提出了改进的变体，同时论文也介绍了一些对预
PDF3 years ago
预测分子属性中旋转等变卷积的相关性
本文探讨将角度特征直接纳入分子属性预测的实际价值，通过对 e3nn 与 QM9 数据集进行消融研究，发现旋转等变层相对于增加网络深度来说更为参数有效。在保持网络深度和参数数量稳定的情况下，加入角度特征可以平均降低测试误差 23%，特别是在偶
PDF4 years ago
从大到小：多尺度局部平面引导单目深度估计
本文介绍了一种网络架构，利用位于解码阶段多个阶段的新型本地平面指导层来更有效地引导密集编码特征以进行所需的深度预测，并在具有挑战性的基准测试中通过消融研究证明所提出的方法优于最先进的作品。
PDF5 years ago
用于段落重新排名的更新 Duet 模型
本文提出了对 Duet 深度神经排名模型的若干小修改，并在 MS MARCO 文章排名任务上进行了评估，根据消融研究，我们报告了所提出的改进的显著提升。
PDF5 years ago
AAAIRainbow: 深度强化学习的综合改进
本文通过详尽的消融研究，考察了 6 种方法扩展 DQN 算法，实验结果表明这些方法的综合应用取得了 Atari 2600 基准测试最先进的性能，在数据效率和最终性能方面都取得了显著的改善。
PDF7 years ago
可视化与理解卷积网络
介绍了一种新的可视化技术，通过消融研究得出了超越 Krizhevsky 等在 ImageNet 分类基准上的模型架构，其 ImageNet 模型表现优异并且泛化性良好，可以轻松地在其他数据集上取得优异的分类效果。
PDF11 years ago