- EMNLPSSCR: 通过自监督因果推理进行迭代式基于语言的图像编辑
本研究提出一种自我监督对抗推理 (SSCR) 框架,以克服迭代语言图像编辑任务中的数据稀缺性,并在两个 IBLIE 数据集上取得了新的最先进 (SOTA) 的成果,即使只使用 50% 的训练数据,SSCR 也能获得与使用完整数据相当的结果。
- 手语识别技术现状的定量调查
本研究针对包括 1983 年至 2020 年间数量众多的手语识别论文,共计 300 余篇,400 余个试验结果进行了元研究,并对本领域标准数据集 RWTH-PHOENIX-Weather 2014 进行了 25 多个研究的精细分析。研究涵盖 - 中间任务训练提高零样本跨语言迁移能力
本研究主要研究在非英语任务上英语中间任务训练(Intermediate-task training)是否有助于跨语言理解学习迁移,通过在 XTREME 基准测试上得到大幅度的改进,我们的最佳模型超过了 XLM-R Large,成为 2020 - IMoJIE: 迭代基于内存的联合开放信息提取
本文介绍了一种基于神经网络的扩展模型 IMoJIE,该模型在 Open Information Extraction 任务中可以产生变化的、多样化的信息提取结果。与先前的基于规则的系统相比,该模型取得了 18 个 F1 分数的优势,也超越了 - 通用 - 特定低秩分解的高效领域泛化
该论文提出了一种名为 CSD (Common Specific Decomposition) 的算法,它能够对神经网络的最终分类层进行修改,从而实现领域通用性。CSD 不仅能匹配目前领域内最先进的方法,还可以在领域消除、领域扰动数据增强和元 - ECCVF, B, Alpha 抠图
该论文提出了一种低成本的改进方法,以预测前景和背景的颜色,进而实现图像抠图和透明区域补色,并通过多种方法对深度学习网络进行了训练,实现在 Adobe Composition-1k 数据集和 alphamatting.com 的在线评估中达到 - ICML部分标签学习中真实标签的逐步识别
本文提出一种新颖的部分标签学习框架,通过提出一种新的分类风险估计器、分析分类器一致性和建立估计误差界限来解决现有方法面对大规模数据计算复杂度瓶颈的问题,并通过实验验证其成为业界新的标杆。
- CVPR基于网格式记忆的 Transformer 图像字幕生成
使用 M$^2$ - Meshed Transformer with Memory for Image Captioning 的架构,改进了图像编码和语言生成步骤;通过测试,证明该架构在单模型和集成配置上达到了新的最佳状态,尤其是在描述训练 - EMNLP用于多跳问答的层次图网络
本文介绍了一种基于分层图网络的多跳问答模型,通过构建不同粒度层次的节点来聚合多个段落中分散的线索,使用预先训练的上下文编码器对节点进行初始化,通过图传播等方式更新节点表示并实现多跳推理,实验结果表明,该方法在 HotpotQA 基准测试中取 - 组件注意力引导的人脸超分辨率网络:CAGFace
通过卷积神经网络实现人脸超分辨率,使用面部分割和注意力机制保留面部特征,迭代地对高分辨率图片进行处理以达到更好的视觉效果和量化指标,达到了当前技术的最佳表现。
- ICLRSEED RL:可伸缩高效的深度强化学习与加速化的中心推理
SEED 是一种现代可扩展强化学习代理程序,采用分布式算法 IMPALA/V-trace 和 R2D2,可以在 Atari-57、DeepMind Lab 和 Google Research Football 上进行评估,并且比当前方法更具 - 白盒与黑盒:成员推断的贝叶斯最优策略
本文探讨了成员推断中的最优策略。我们发现最优攻击仅取决于损失函数,因此黑盒攻击与白盒攻击一样好。通过多种逼近方法,我们的成员攻击在各种设置中均优于现有技术。
- 稳健的单目深度估计:通过混合数据集实现零样本跨数据集转移
本文提出了一种深度估计的训练方法,利用多种不同来源的数据集和多目标学习来提高训练效果,同时跨数据集的测试结果表明该方法优于竞争方法并取得了深度估计领域的最新成果。
- 机器人的持续学习:定义、框架、学习策略、机遇和挑战
这篇论文介绍了连续学习的概念和机器学习中面临的挑战,提出了在自主体或机器人中使用连续学习以适应环境和优化学习过程的方法,并介绍了现有的基准和度量标准,并提出了一种框架来评估这些方法的有效性。
- 具有局部约束的源目标自注意力
本论文提出了一种基于 transformer 模型的新型神经机器翻译架构,采用自注意力机制加局部约束对 attention 接受场进行改进,实现了在多个翻译基准数据集上的最新 BLEU 最优结果。
- ICCV寻找 MobileNetV3
MobileNetV3 采用一种新的架构设计和自动搜索算法相结合的综合搜索技术用于优化移动设备上的图像识别任务,在分类、检测和分割等任务上实现了最新的性能水平。
- Transformer 语言模型的动态评估
这篇研究使用 Transformers 和动态评估两种方法来提高语言建模,在多个数据集上的实验表明,使用动态评估提高了模型预测准确率。
- DocBERT:文件分类的 BERT 模型
本研究使用 BERT 进行文档分类,并展示出其在四个流行数据集上的最新成果。为了解决 BERT 推理的计算开销,研究者提出使用知识蒸馏技术,将 BERT 的知识转移到小型双向 LSTM 中,并使用 30 倍更少的参数达到了 BERT-bas - ACL语法错误纠正的语料生成
本研究使用了序列到序列的框架对语法纠错进行建模。通过两种方法生成了大量的 Wikipedia 平行数据集,并使用迭代解码策略训练了神经语法纠错模型,最终在 CoNLL-2014 基准和 JFLEG 任务中实现了领先于现有技术的表现。
- CVPR适应性 NMS: 在人群中优化行人检测
本文提出一种使用新型非极大值抑制(NMS)算法解决人群中的行人检测问题,使用自适应 NMS 和学习密度得分的子网络,可以有效改善边界框的精确度,并在 CityPersons 和 CrowdHuman 基准测试中取得了最先进的结果。