- 基于数据驱动的高斯过程方法识别泊松哈密顿 D-A-E 系统
基于数据驱动的方法,我们提出了一种用于端口 - 哈密顿微分代数方程 (DAE) 系统的识别方法,该方法利用输入和状态空间数据来估计 pH-DAE 系统的非线性努力函数。
- NTIRE 2024 低光图像增强挑战:方法与结果
该论文回顾了 NTIRE 2024 年低光图像增强挑战,突出了提出的解决方案和结果,旨在发现在处理各种条件时能够生成更明亮、更清晰和更具视觉吸引力结果的有效网络设计或解决方案,包括超高分辨率(4K 及以上)、非均匀照明、逆光、极端黑暗和夜景 - CVPR重写星空
通过元素级乘法(即 “星操作”)将输入映射到高维非线性特征空间的能力,类似于内核技巧,而无需扩大网络,本研究尝试揭示 “星操作” 在网络设计中的未开发潜力,并引入了 StarNet 作为一个简单而强大的原型,表现出了在紧凑的网络结构和高效的 - 通过不确定性量化从量化网络中提取可用的预测结果进行 OOD 检测
使用不确定性量化技术对预训练视觉模型进行预测不确定性估计,以提取有价值的预测并忽略不自信的预测,从而避免最多 80% 的被错误分类的样本。
- 设计用于多尺度计算机视觉的高性能网络
通过改进计算机视觉模型的网络设计,特别是针对多尺度计算机视觉任务的新网络设计,这篇研究论文旨在超越现有文献中的基准设计,保证了公平的比较,并公开了代码。
- AAAI优化原子拥塞的复杂性
计算系统最优策略的计算复杂性在领域中鲜有研究,本论文通过参数化复杂性范式,确定了问题的可处理边界,并且发现控制问题计算复杂性的结构性参数不是基于顶点分离器,而是基于边分离器。
- 实际单图像非监督目标分割的基准测试和分析
研究旨在系统研究现有无监督模型在具有挑战性的真实世界图像上的有效性,发现现有无监督模型在真实世界图像中很难分割普通物体,因为现有模型所引入的归纳偏差难以捕捉不同目标的分布。未来的工作应该在网络设计中更充分地利用显式的目标偏差。
- 迈向可扩展的无线联合学习:挑战与解决方案
通过网络设计和资源编排的两个方面讨论了实现可扩展无线联邦学习的挑战和解决方案,并提出了三种面向任务的学习算法来提高算法的可扩展性,实现对无线联邦学习的计算高效资源分配。
- 将视觉 Transformer 解析为具有动态卷积的卷积神经网络
我们将视觉 Transformer 解释为具有动态卷积的 ConvNets,并在统一框架中比较它们的设计选择,证明了视觉 Transformer 可以以 ConvNets 的设计空间为参考,从而指导网络设计,并展示了如何通过更换激活函数和创 - LLM 网络更宽更深公平度更高的 LLM 评估器
通过使用深度神经网络进行评估,并通过宽度和深度的网络设计来提高 LLMs 的质量评估,研究表明具有多个评估者的宽度网络在改善相关系数和节约成本方面具有最佳性能,同时 WideDeep 在辅助对中文 LLMs 的评估方面取得显著进展。
- 5G NR 下低延迟 XR 的 AI 辅助改进服务提供
利用预测帧进行处理而不仅依赖于实际帧的新型人工智能辅助服务提供方案,通过虚拟增加了网络延迟预算,从而提高服务提供效率。
- DIPNet:图像超分辨率的效率蒸馏与迭代剪枝
文章提出了一个新的多阶段轻量级网络增强方法,利用加强的高分辨率输出作为轻量级学生网络的附加监督,进一步简化网络结构并采用有效的轻量级网络训练策略,实现了在 NTIRE 2023 高效超分辨率挑战赛中的最快推理时间,同时保持竞争力超分辨率性能 - CVPR单张 2K 分辨率图像实现高保真 3D 人体数字化
提出了一种名为 2K2K 的简单而有效的 3D 人体数字化方法,该方法构建了一个大规模的 2K 人体数据集并从 2K 分辨率图像推断出 3D 人体模型,通过多个网络恢复了人体的全局形状和细节,并使用现有的网格生成器重构了完整的 3D 人体模 - 傅里叶变换在神经时间序列分析中的应用:综述
本论文以傅里叶变换为基础,系统回顾了神经时间序列分析的最新研究进展,提出了一个四方面的分类学体系,并对一些新的研究方向进行了讨论。
- 实际单一图像中的无监督物体分割:前景还是泡影?
本文研究了从单幅图像进行无监督物体分割的问题,通过系统地研究现有无监督模型在具有挑战性的现实世界图像上的有效性,发现现有无监督模型在真实世界的图像上无法有效地分割普通物体,因此需要在网络设计中利用更明确的对象性偏差。
- YOLOv6: 面向工业应用的单阶段物体检测框架
本技术报告介绍了 YOLOv6 的开发和部署,该模型包括最新的网络设计、训练策略、测试技术、量化和优化方法,可适用于不同规模的应用场景,并在各种硬件平台上表现出色。
- 深度学习中的表征复杂度
通过分析学习表示在分离不同类别方面的有效性,使用简单的复杂度指标,研究表明数据复杂度随着网络层数增加和训练的进展而变化,受网络设计和训练样本的影响
- 对比自监督学习与非对比自监督学习之间的二元性
本文探讨了施加对比方法与协方差为基础的非对比方法的理论相似性,说明在合理的假设下它们是等效的。作者介绍了一些改进和变化,证明了这种理论结果,提出了更好的网络设计和超参数调整,可以让不同的 SOTA 方法更好地融合,以建立更好的自监督学习方法 - TRT-ViT:针对 TensorRT 的 Vision Transformer
本文主要从实际应用的角度重新审视 Transformer,并将硬件延迟作为衡量计算效率的指标,提出一系列针对 TensorRT 的网络设计实践指南,并给出了一家 TRT-ViT 的网络模型,实验表明在不同的视觉任务中,TRT-ViT 在延迟 - NTIRE 2022 高效超分辨率挑战赛:方法与结果
本文概述了 NTIRE 2022 有关高效单幅图像超分辨率的挑战,重点在于提出的解决方案和结果。比赛的目标是设计一个单幅图像超分辨率网络,使其在保持 29.00dB 的 PSNR 的同时,在几个度量标准,包括运行时间,参数,FLOPs,激活