- 直接生成分子构象
本研究提出了一种新的方法,直接预测分子的坐标,通过适应性地聚合键和原子信息,迭代地细化生成构象的坐标,该方法在 GEOM-QM9 和 GEOM-Drugs 数据集上取得了最佳结果,并通过提供更好的初始构象来改善分子对接。
- MM半自回归式图像字幕
该研究提出了一种新的两阶段模型,称为半自回归图像字幕生成模型,使用部分先验信息和图像特征,先以自回归方式生成一个间歇性序列,然后使用迭代的非自回归方式填充所有跳过的单词,可以更好地权衡性能和速度,并在 MS COCO 基准测试上得到更好的表 - 用于光流的细节保留残差特征金字塔模块
通过引入残差特征金字塔模块(RFPM),提出了一种新颖的光流估计方法,该方法保留了特征图中的重要细节,同时修正了特征金字塔中的对象混合问题,进而减少了光流估计中的错误,并实现了在多个数据集上的快速转移学习。
- WaveGrad 2: 文本到语音合成的迭代改进
本论文介绍了 WaveGrad 2,这是一种非自回归的生成模型,用于语音合成。通过迭代细化过程,模型使用梯度估计语音波形的对数条件密度,从而生成音频波形。实验证明,该模型可以生成高保真音频。
- GENESIS-V2:无需迭代细化的非排序对象表示推断
该研究提出了一种基于嵌入和聚类的方法,避免了对对象在图像中进行自然排序的需要,同时避免了需要在图像中初始化固定数目的对象表示。使用此方法,开发了新模型 GENESIS-v2,可推断变量数量的对象表示,表现强于已有的基线模型,适用于已有的合成 - ICCV基于残差框架的迭代精化 StyleGAN 编码器
本研究探讨了一种名为 ReStyle 的迭代残差编码器,用于将图像反演为对应的潜在编码,以便于对真实图像进行操作和利用网络所学的语义。相比现有方法,ReStyle 的精度有所提高而推理时间基本不变,同时对其进行的评估和分析也表明其相对于现有 - House-GAN++:生成对抗布局优化网络
通过一种基于生成对抗网络的自动化平面图生成方法,使用基于图的相关生成对抗网络和条件生成对抗网络的集成,并在迭代布局细化过程中使用之前生成的布局作为下一个输入约束。该研究提出了一种名为组件方式 GT 调节的简单非迭代训练过程,有效地学习这样的 - 一种用于非刚性形状匹配的双重迭代细化方法
本研究提出了一种基于双重迭代精化(DIR)的解决方案,通过优雅的方法将空间和频谱数据融合起来,从当前迭代中提取更多准确的信息用于下一次迭代,有效地将双重信息结合在一起,从而提供了一种高效而稳健的密集对应解决方案。
- ECCV非局部空间传播网络深度补全
该研究提出了一种鲁棒和高效的端到端非局部空间传播网络,用于深度完成,该算法通过迭代细化初始深度预测并利用非局部邻居和对应的亲和力进行空间传播,提高了深度完成的准确性和鲁棒性,并在混合深度问题上具有较强的适应性。
- 迭代结构细化进行的语义角色标注
该文介绍了一种用于语义角色标注(SRL)的迭代优化方法及网络结构,通过建立非局部交互关系,有效提高了模型表现,在七种 CoNLL-2009 中取得了最优表现并在其中五种语言中的英语数据集上取得了最新的成果。
- CVPR多看一眼:一种针对任意形状文本的准确检测器
用 LOMO(即 Look More Than Once)方法解决了传统的场景文本检测方法中受限于 CNN 的感受野和简单的形状描述方法在处理长文本和任意形状文本时的不足,该方法包含直接回归器(DR)、迭代细化模块(IRM)和形状表达模块( - FA-RPN:浮动区域提议以用于人脸检测
我们提出了一种新颖的区域生成方法,用于执行面部检测,该方法使用基于池化的方法生成区域提案,通过提出一种有效的锚点放置策略来降低锚点数量,并演示了我们的网络生成的提案优于 RPN 用于生成面部检测的区域提案,这种方法还有迭代优化、浮点锚点设置 - ECCV用于高效地标定位的量化密集连接 U-Net
本文提出了针对视觉地标定位的量化密集连接 U-Nets,通过采用 order-K 密集连接,并使用内存高效的实现来提高训练效率,以及使用低位宽数字量化权重、输入和梯度来降低内存消耗和高精度操作,实现了比其他基准定位器使用约 70% 更少参数 - 基于拓扑感知的超越像素级误差的分割方法
本文介绍了一个新的深度学习方法,使用新的损失函数和迭代优化策略来提高计算机视觉中曲线结构识别的精度,并在多种图像数据集上展示了优越性。
- ICLR残差连接鼓励迭代推断
研究表明,Residual networks 可以通过迭代改进特征来执行表示学习和迭代细化,但对于这一过程的全面理解仍然是一个研究课题,并且共享残差层会导致表征爆炸和过拟合,需要采用现有的策略来缓解这个问题。