model | BriefGPT - AI 论文速递

关键词model

搜索结果 - 98

ECCV基于注意力机制的查询扩展学习
提出一种基于自我注意力机制的模型，以更高的准确性进行查询扩展，克服现有方法的缺陷。
PDF4 years ago
元学习需要元增强
本文提出了 Meta-Learning 中的过拟合问题，并使用信息理论框架讨论基于元学习数据增强的方法来解决这个问题。实验证明，该方法对最近提出的元规则技术有很大的补充作用。
PDF4 years ago
为修改模型决策综合行动序列
该研究通过程序综合的方式，结合测试中的敌对攻击和特定领域的操作序列，构建可行的、最简便的操作序列，以帮助人们改变分类结果，实验表明该方法对于深度神经网络具有较好的效果。
PDF5 years ago
ACL来自平行翻译的简单有效的释义相似度
从双语语料中直接学习释义句子嵌入的模型和方法，有效消除创建释义文本体的耗时环节。进一步地，该模型可用于跨语言任务，其性能优于且比最先进的复杂基线算法快几个数量级。
PDF5 years ago
EMNLP通过学习说服问答模型来寻找可推广的证据
使用基于句子的问题回答 (QA) 作为实验场景，我们提出了一种系统，该系统能够找到最强有力的支持证据以证明问题的答案，我们训练证据代理程序，以选择能够最具有说服力地证明给定答案的句子，这些证据不包括完整段落，我们发现，证据代理程序选择一般化
PDF5 years ago
UER: 一个用于预训练模型的开源工具包
我们提出了一种可按需组装的预训练工具箱，即通用编码器表示（UER），通过 UER，我们建立了一个模型动物园，其中包含基于不同语料库，编码器和目标（目标）的预训练模型，使用适当的预训练模型，我们可以在一系列下游数据集上实现新的最先进结果。
PDF5 years ago
面向任务的视频摘要元学习
本文提出了一种元学习方法 MetaL-TDVS，该方法针对任务驱动的视频摘要任务进行显式探索，以发掘不同视频摘要过程之间的视频摘要机制，从而提高训练模型的泛化能力。 MetaL-TDVS 将每个视频的摘要作为一个单一任务，并通过两种方式的反
PDF5 years ago
解耦影响：使用解耦表示审计模型预测
本文提出了一种评估模型特征影响的新方法，利用消解表示来识别数据集中的代理特征，并显式计算特征对个体和聚合结果的影响，结果表明该方法比现有方法更加有效。
PDF5 years ago
CVPR深度人员再识别的技巧和强基线
本文探讨了一种简单有效的人物再识别（ReID）基线，并通过组合有效的训练技巧，在仅使用全局特征的情况下，在 Market1501 数据集上实现了 94.5％的排名 - 1 和 85.9％的 mAP。
PDF5 years ago
人物再识别中的属性辅助部位检测与细化
本文介绍了一种新的人物属性检测方法，利用属性检测来生成相应的局部检测器，提取局部特征来解决人物再识别中的身体部分不对齐问题，并将属性信息与局部描述符相结合以消除检测偏差带来的干扰。该模型在两种常用基准测试上表现良好。
PDF5 years ago
ColorNet: 探究色彩空间在图像分类中的重要性
探讨了颜色空间对于图像分类的影响，展示了多颜色空间模型在 CIFAR-10、CIFAR-100、SVHN 和 Imagenet 等多个数据集上都能够取得高水平的分类准确度，并且参数数量很少。
PDF5 years ago
视觉蕴涵：一种精细图像理解的新任务
本文介绍了一个新的推理任务 Visual Entailment（VE），并构建了一个数据集 SNLI-VE，用于评估已有的 VQA 基线和构建了一个名为 EVE 的模型来解决 VE 任务，这个模型达到了 71% 的准确率并展示了 EVE 通
PDF5 years ago
多方机器学习中的污染攻击及其缓解
本文讨论了在多方数据联合训练机器学习模型时，可能存在一方恶意注入污染数据导致模型性能下降的问题，并提出了采用对抗训练的方法可以避免此问题，同时保证各方数据的隐私安全。
PDF5 years ago
模型驱动的强化学习中规划器过拟合问题的缓解
探索一种中间立场，通过对其考虑的计划进行一种正则化来避免过度拟合，该论文提出了三种不同的方法，可在强化学习环境下明显缓解计划器过度拟合。
PDF6 years ago
AAAI论述性神经机器翻译的连贯性建模
本研究提出一种使用话语上下文和奖励机制来从话语角度提高翻译质量的模型，能够有效提高翻译质量和话语连贯性。
PDF6 years ago
上下文感知原型编辑的响应生成
本文提出了一种响应生成的新范 Paradigm，通过编辑现有的原型响应，显著增加了生成结果的多样性和信息量，提出了一种响应编辑模型，实验结果表明，该模型在各个方面都优于传统的生成和检索模型。
PDF6 years ago
量子启发式复杂单词嵌入
本研究提出两个量子力学启发式模型，通过基于希尔伯特空间的相对相位来探究单词组合的含义，从而在二进制句子分类任务上达到了比非量子模型更好的性能。
PDF6 years ago
蛋白质模型质量评估的深度迁移学习
该研究提出了一种基于深度神经网络的蛋白质模型质量预测方法，利用少量输入特征和粗略模型描述以及数据库中已知蛋白质结构的迁移学习，达到了最先进的性能表现。
PDF6 years ago
ELEGANT: 用 GAN 交换潜在编码传递多个脸部属性
本文提出了一种新颖的模型，通过在潜在空间中对所有属性进行解缠编码，实现了能够同时操作多个特征的图像生成，性能在 CelebA 人脸数据库上得到了验证。
PDF6 years ago
一夜建立梵文分词器
提出了一种基于序列到序列模型的 Sanskrit Sandhi 文本分词方法，该模型只使用 Sandhi 化字符串作为输入，并预测正常分词的字符串，经过实验比当前最先进的模型具有更好的表现，且可在一晚上进行训练并应用于生产。
PDF6 years ago