deep models | BriefGPT - AI 论文速递

关键词deep models

搜索结果 - 161

通过逻辑回归归因匹配实现对比领域泛化
本文通过引入 Contrastive Domain Generalization（CDG）方法，探究以强对比数据对中的语义不变性来进行域泛化的方法，并提出了一种名为 Logit Attribution Matching（LAM）的正则化技术
PDFa year ago
IJCAI基于图形消歧的深度部分多标签学习
本文提出利用图形解析和深度模型相结合的方法 ——PLAIN 应对 PML 问题，提高其精确性和鲁棒性。该方法在多个合成数据集和三个实际 PML 数据集上都表现出显著的优越性。
PDFa year ago
CroSel: 针对部分标签学习的自信伪标签交叉选择
本文提出了一种新的方法 CroSel 来解决部分标签学习（PLL）问题，利用深度模型的历史预测信息识别大多数训练样例的真实标签，并证明在基准数据集上 CroSel 优于之前的最先进方法。
PDFa year ago
CVPRSCPNet：点云上的语义场景补全
提出了三种解决方案，包括对完成子网络的重新设计，使用知识蒸馏从多帧模型中提取知识以及完成标签修正，并在 SemanticKITTI 和 SemanticPOSS 数据集上进行了扩展实验。SCPNet 表现出比竞争对手更好的结果，展示了场景完
PDFa year ago
瓷砖网络：学习整页推荐的最佳几何布局
本文提出了一种名为 Tile Networks 的神经网络架构，它利用强化学习算法对 2D 平面上的物品进行配置优化，实现了全页推荐的配置优化问题。实验结果表明，相比于传统排序方法和最近的深度学习模型，Tile Networks 具有更优异
PDFa year ago
语义扩散网络用于语义分割
本文提出了一种运用语义扩散网络（SDN）进行边界特征增强来提高深层语义分割模型预测性能的方法，包括运用各向异性扩散过程进行边界特征增强和引入可学习的 SDN，通过提出的 SDN，可以构建从原始特征到跨类边界增强特征的可微映射。实验证明，我们
PDFa year ago
知识增强的神经机器推理：综述
本文综合研究了知识增强的神经机器推理领域，分类总结了现有方法，并探讨了应用领域和未来研究前景。
PDFa year ago
AAAI语言模型是鼓手：使用自然语言预训练进行鼓乐合成
本研究提出使用深度模型进行跨领域的知识迁移，将大规模预训练的语言模型应用于鼓演奏的 MIDI 文件生成。研究表明，GPT3 模型能够生成相对合理的鼓声，但使用其他没有预训练的模型却无法实现。同时，作者还提出了定制结构评估方法，以比较生成的音
PDF2 years ago
P3DC-Shot: 基于先验的离散数据校正用于最近邻少样本分类
P3DC-Shot 是一种基于最近邻居分类的 few-shot 分类方法，通过离线提取特征来对查询数据进行分类。它可以通过离线提取的特征，找到最接近的支持类并对查询数据进行分类。该方法利用了基础类的分布或统计信息来校准数据，将 NN 分类使
PDF2 years ago
TextGrad: 基于梯度驱动优化的 NLP 鲁棒性评估进展
在 NLP 领域缺乏第一阶梯度的鲁棒性评价框架，本文提出 TextGrad，一种新的基于梯度驱动的攻击生成器，支持高准确性和高质量的文本鲁棒性评估，并通过实验验证了其在攻击生成和防御等方面的有效性。
PDF2 years ago
UniGeo: 通过重构数学表达式统一几何逻辑推理
本文介绍了一个基于多任务转换器框架 Geoformer 的大规模统一几何问题基准测试 UniGeo，通过共同表达式生成的方式统一解决计算和证明问题，并提出了预测数学表达式的方法 MEP，从而提高了 Geoformer 的性能。
PDF2 years ago
AAAIAdaCM: 自适应 ColorMLP 实时通用照片逼真风格迁移
提出了一种名为 AdaCM 的基于 Adaptive ColorMLP 的有效和高效的通用照片逼真风格转移框架，可以在超快的速度下处理 4K 分辨率图像，并且可以生成生动、高质量的样式化结果。
PDF2 years ago
消失的决策边界复杂度与强第一组件
通过研究神经网络的决策边界，发现深度学习模型的边界相对简单，但通过先前模型的决策边界可以研究最终模型的泛化能力，此外还探讨了深度模型的第一主成分的强度、优化器的奇异性以及 ResNet 中跳跃连接的影响。
PDF2 years ago
使用基于模型的品质多样性和梯度的高效探索
本文介绍了一种基于模型的 Quality-Diversity 算法，该算法通过对所有群体成员进行有效的探索和利用想象中的扰动来同时维持性能和高效的多样性，从而提高人群算法在具有欺骗性奖励的任务中的样本效率和解决方案质量。
PDF2 years ago
鲁棒语言模型的伪 OOD 训练
本文提出 POORE - POsthoc pseudo-Ood REgularization 框架，通过在内部数据中生成伪 OOD 数据进行 fine-tune，通过引入新的正则化损失来分离 IND 和 OOD 数据的嵌入，提高了 OOD
PDF2 years ago
通过知识蒸馏学习可推广的车辆路径问题模型
本文提出了一种自适应多分布知识蒸馏（AMDKD）方案，通过利用来自多个已训练教师模型的知识来生成轻量级且更广义的学生模型，从而解决了现有神经方法在车辆路径问题上交叉分布泛化的问题，并展示了其优异的性能。
PDF2 years ago
ECCV提高置信度估计的可靠性
本研究提出了一种基于元学习的框架来同时提高置信度估计模型在不均衡数据和各种数据输入情况下的表现，并在单目深度估计和图像分类任务中进行了验证。
PDF2 years ago
ECCV一种针对目标检测的大规模多目标黑盒攻击方法
该研究提出了一种基于多目标优化的攻击方法，可以最小化真正例率和最大化假正例率，通过使用改进的遗传算法 (GARSDC) 和利用不同探测器间的可迁移性，大大提高了攻击效率和性能。
PDF2 years ago
基于 BERT 的集成方法用于仇恨言论检测
本文聚焦于利用包括 BERT 在内的多个深度模型以及集成学习等技术，对社交媒体上的仇恨言论进行分类，使用三个公开 Twitter 数据集进行实验并考察多种方法的分类性能，最终以新数据集 DHO 进行多标签分类，取得了不错的成果，尤其在集成学
PDF2 years ago
naab: 一份即插即用的波斯语语料库
提供一份 130GB 的 Farsi 語言文本語料庫 naab，它包括 25 億段落和 15 兆個單詞，以及一個用於生成自定義語料庫的預處理器。
PDF2 years ago