- 暗环境下采用时间编码事件驱动神经网络的注视向量估计
本文研究了注视向量预测的复杂挑战,重点是在极低光条件下的创新方法,通过使用一种新的时间事件编码方案和专用的神经网络架构,将动态视觉传感器(DVS)事件与灰度引导帧无缝集成,生成连续编码图像输入到神经网络中,这种独特的解决方案不仅捕捉了活跃年 - 多旋翼飞行器定位的主动推进噪声整形
通过主动控制和塑造由旋翼产生的飞行器推进噪声,该论文提出了基于自噪声的已知环境中的定位的神经网络体系结构,通过与学习时间变化的旋翼相位调制相结合的训练,实现了准确和稳健的定位。
- LISR:利用紧致支持径向基函数学习线性三维隐式曲面表示
从部分和嘈杂的三维点云扫描中隐式三维表面重建是经典的几何处理和三维计算机视觉问题。本文提出了一种基于局部支持紧致径向基函数的线性隐式表面表示,并通过使用带标记距离场 (SDF) 数据进行监督学习,学习了物体的三维表面的线性隐式形状表示。所提 - 自洽的上下文感知转移学习器用于语音识别
我们提出了一种基于转录者的新型神经网络架构,通过增加上下文信息流来提高自动语音识别系统的准确性,特别是对于不常见的词语识别准确性的改进。我们研究了使用该新模型和 / 或与上下文语言模型浅层融合时不常见词的准确性改进,并发现两者的组合在不常见 - 遮蔽式 LoGoNet:医学领域快速精确的三维图像分析
本研究介绍了一种名为 LoGoNet 的新型神经网络架构,通过自监督学习方法解决了现有机器学习图像处理方法在医学应用中的挑战,提高了医学影像分割的性能。
- 将泰勒级数和递归结构纳入神经网络中用于时间序列预测
本文介绍了一种新颖的神经网络架构,该架构整合了 ResNet 结构的元素,并引入了 Taylor 级数框架的创新融合。这种方法在许多基准数据集上展现出显著的测试准确性改进,并进一步通过引入递归步骤来提高测试准确性。我们的研究结果强调了我们提 - 物理信息神经网络密集倍增
提出了一种密集乘积 PINN (DM-PINN) 架构,通过将隐藏层的输出与所有后面的隐藏层的输出相乘,不引入更多的可训练参数,它可以显著提高 PINNs 的准确性。对四个基准示例 (Allan-Cahn 方程、Helmholtz 方程、B - torchmSAT:一个 GPU 加速的最大可满足性问题的近似算法
利用机器学习技术将离散结构与组合优化算法集成,提出一种能够近似求解最大满足性问题的可微函数,设计了一种新颖的神经网络结构并借助后向传播逐步求解问题,通过利用 GPU 进行计算加速,论文实验证明这种方法在挑战性的最大满足性问题上优于两种现有求 - 变分 Shapley 网络:基于概率的自解释 Shapley 值与不确定性量化方法
我们引入了一种新颖的、能够显著简化 Shapley 值计算的自解释方法,并且探索了将概率框架纳入其中以捕捉解释中固有的不确定性,它基于一个新颖的遮蔽神经网络体系结构,在模拟和真实数据集上的评估验证了我们技术的稳健预测和解释性能。
- DoubleMLDeep: 多模态数据的因果效应估计
本文探讨了在因果推断和治疗效果估计中使用非结构化多模态数据(即文本和图像)的方法。我们提出了一种适应双机器学习(DML)框架,特别是部分线性模型的神经网络架构。我们还提出了一种新方法来生成半合成数据集,以评估在存在文本和图像混淆因素的情况下 - 深入还是扩展:从 Sobolev 损失的最优泛化误差角度出发
通过比较深度神经网络和宽度神经网络在 Sobolev 损失下的最佳泛化误差,研究了神经网络架构的构建问题,发现样本点数量、神经网络参数和损失函数的正则性等因素都会对神经网络架构产生显著影响,并将这一理论应用于解决偏微分方程的深度 Ritz - 基于导航提议的深度主动感知目标检测
深度学习已经在机器人视觉任务中取得了显著进展,但大多数现有的深度学习方法依赖于传统的计算机视觉流水线中固有的静态推理范例。最近的研究发现,积极感知通过超越这些静态模式来改善各种模型的感知能力。本文提出了一个通用的监督式积极感知流水线,用于目 - 用于哈密顿系统模型简化的辛自编码器
为了解决大维物理系统不同参数选择下的计算成本过高问题,该研究提出了模型简化和神经网络结构的新方法,其中关键是保存系统的辛结构和利用网络设计中的微分几何结构进行训练,该方法在准确性方面表现显著优于现有设计。
- GateNet:一种用于自动流式细胞术分割的新型神经网络架构
通过使用 GateNet 神经网络架构,本研究提出的自动门控方法在流式细胞术中实现了无需矫正批处理效应的全自动门控,验证了其与人类表现相媲美的准确性,并展示了其在各个领域中广泛适用的特点。
- 一个级联神经网络系统用于评估外科手结扎模拟中学生表现
我们提出了一种级联神经网络架构,仅通过学生模拟外科结扎任务的视频评估其表现,通过预训练的深度卷积网络将视频帧图像转换为特征向量,然后用时间网络对帧序列建模。在模拟结扎实验中,我们的模型在决定绳结相关任务的水平时实现了 0.71 的中位数准确 - PerSival: 基于神经网络的肌肉骨骼生物力学中全渗透连续力学模拟的可视化
本研究提出了一种新的神经网络架构,用于对 3D 人类上肢骨骼系统模型进行全面的可视化。利用深度学习模型实现了实时可视化,使得连续力学模拟在视觉实时应用中变得可行。
- DeepPyramid+: 利用金字塔视图融合和可变形金字塔接受的医学图像分割
深度金字塔 + 是一个网络架构,通过引入金字塔视图融合(PVF)和可变形金字塔感受野(DPR)两个重要模块,有效解决了医学图像和手术视频分割中的多种挑战,如异质性类别、可变形形状和透明特征等,通过实验证明了其在各种挑战下的优越表现。
- 失明训练 RL 智能体具有稳健性
通过引入神经网络架构和一种新颖的 n 步损失函数,我们的实现能够经受比训练数据更长的基于位置的视觉障碍,从而展现出对暂时性视盲的鲁棒性。
- 从反应式到主动式波动建模:半球神经网络的应用
我们通过具有专门的均值和方差半球的新型神经网络架构,给宏观经济密度预测重新注入了最大似然估计(MLE)。我们的架构具有几个关键要素,在这个背景下使 MLE 工作。
- MVControl:在多视角扩散中增加条件控制以实现可控的文本到 3D 生成
通过引入 MVControl 神经网络架构,我们成功地提出了一种能够增强现有预训练的多视角二维扩散模型并结合额外输入条件(如边缘图)的方法。通过我们的方法,实现了可控的多视角图像生成和视角一致的三维内容创作。