model | BriefGPT - AI 论文速递

关键词model

搜索结果 - 98

COLINGCHAE：使用角色、动作和情感进行精细可控的故事生成
该论文提出了一种用于故事细粒度控制的模型，它允许根据个性化指导生成定制故事，实验证明其具有强大的可控性。
PDF2 years ago
高效的基于模型的诊断
本文介绍了一种高效的模型诊断过程，针对具有输入输出因果关系的系统。在此诊断过程中，首先确定一组可能破损的组件的焦点；其次，在焦点内确定最具信息的探测点。该诊断过程在组件的连通性低时表现出线性时间复杂度，并可应用于动态系统和包含循环的系统中，
PDF2 years ago
DECK: 从文本中检测抑郁症的 BERT 模型行为测试，提高其可解释性和泛化能力
这篇论文介绍了一种名为 DECK 的测试方法，可以提高 BERT 分类器在抑郁领域的解释性和泛化能力，通过 DECK 测试提出的训练数据和一些特定抑郁症状的信息，可以显著提升 BERT、RoBERTa 和 ALBERT 三个模型的泛化能力高
PDF2 years ago
一种新型对抗样本
该论文提出了一种新型对抗性攻击方法 NKE，能够在图像中添加可察觉的干扰，导致人类决策产生错误，但对于模型却维持原始决策，实验结果表明该方法能够有效地欺骗深度神经网络。
PDF2 years ago
ACL多模态情感分析中模态鲁棒性分析
提出诊断稳健性检查和训练策略，以提高多模态情感分析模型的稳健性和性能，证明可以在不危及原始性能的情况下实现稳健性，是多模态情感分析研究中一个重要组成部分。
PDF2 years ago
应用机器学习预测波兰华沙市公交运输行为
本研究使用波兰华沙的公交车定位数据，探讨了建立公交车行为模型及预测公交车延误的问题，并给出了初步的研究结果。
PDF2 years ago
ACL从上下文语言推断奖励
本文提出了一种基于语言认知的模型，不仅能够从语言中推断出用户的奖励函数，以便在新环境中实现期望的操作，而且能够更准确地推断奖励并预测新环境下的最佳操作，相比于以往的指令跟随和逆向强化学习方法。
PDF2 years ago
ICLR大规模双语言 - 图像对比学习
本文介绍了利用 11 亿的图文对数据（7.08 亿的韩语数据和 4.76 亿的英语数据）训练出的一种名为 KELIP 的韩 - 英双语多模态模型的简单而有效的训练方案，并证明了该模型在两种语言中的性能相当竞争力，同时讨论了一些与多模态相关的
PDF2 years ago
利用大规模预训练技术自动化代码审查活动
该研究提出利用预训练技术来自动化代码审查，使用 4 项专门为代码审查场景定制的预训练任务，建立了包含 9 种流行编程语言的大规模真实世界代码变更和代码审查数据集，并创建了基于这些数据的高质量基准数据集，针对与代码审查活动相关的 3 个关键任
PDF2 years ago
物理知识图学习
系统评述基于物理规则优化的图学习模型方法及其挑战。
PDF2 years ago
ICML利用可利用信息解读数据集难度
本文提出了一个度量模型难度的方法，并使用输入属性的变换模拟模型难度，发现了广泛使用的 NLP 基准测试集中的注释缺陷。
PDF3 years ago
ICLR分析语言模型中个别神经元的陷阱
本文讨论了使用外部探针的方法评估神经元与语言相关性的方法，指出其存在的问题并提出新的评估方法。
PDF3 years ago
ICCV凝固的时间：一种用于端到端检索的联合视频和图像编码器
本研究目标是视频文本检索 - 特别是一种联合嵌入，可以实现高效的文本到视频检索。作者们提出了一种端到端可训练的模型，旨在利用大规模的图像和视频字幕数据集。该模型是近期 ViT 和 Timesformer 框架的改进扩展，包括时间和空间方面的
PDF3 years ago
IJCAI泛化到未见领域：关于领域泛化的调查
这篇论文是对近年来领域泛化（即在一个或多个不同但相关的领域中学习出可以推广到看不见的测试领域的模型）领域的最新进展的首次回顾，涵盖了相关的理论、算法、数据集、应用，并提出了未来的研究方向。
PDF3 years ago
通过呼吸和咳嗽声音进行端到端 COVID-19 检测
本研究利用自发集成的数据集，首次尝试使用端到端的深度学习方法对 COVID-19 进行诊断，ROC-AUC 为 0.846；引入自定义的深度神经网络，以关节呼吸和咳嗽表示的方式诊断 COVID-19；提供了四个分层折叠的数据集以及模型细节，
PDF3 years ago
Noise2Same: 优化自监督约束用于图像去噪
本文提出了一种新的自监督去噪框架 Noise2Same，不需要 J - 不变性或额外的噪声模型信息，可在更广泛的去噪应用中使用，实验证明 Noise2Same 在去噪性能和训练效率方面显著优于以往的自监督去噪方法。
PDF4 years ago
EMNLP零样本立场检测：使用广义主题表示的数据集和模型
本文研究如何利用直觉表示捕捉话题之间的隐式关系，提出了一种适用于零样本学习的立场检测模型，并提出了一个新的数据集用于测试。结果表明，这个模型在许多有挑战性的语言现象上表现得更好。
PDF4 years ago
ECCV通过视觉匹配实现自适应文本识别
该研究旨在解决文档中的文本识别的泛化和灵活性问题。该研究提出了一种新模型，通过利用语言中字符的重复性，将文本识别转化为形状匹配问题，从而实现了外观的泛化和分类的灵活性。该模型可以解决传统架构无法解决的挑战，并在不同字母表的合成和真实数据集上
PDF4 years ago
跨模态分布匹配的半监督多模态情感识别
提出了一种基于跨模态分布匹配的半监督多模态情感识别模型，该模型利用丰富的未标记数据增强模型训练，实验结果表明该模型能够有效地结合多模态并利用未标记数据提高情感识别性能，并在同等条件下优于其他最先进的方法。
PDF4 years ago
ICMLDQI: 基准评估指南
最近的研究揭示了基准 B 与 C，D 和 E 之间的区别，提出了一种新颖的数据质量指标 DQI，以解决此问题，从而帮助模型实现真正的学习任务。
PDF4 years ago