视频中人声检测
通过创造一种新的损失函数,将目标分类损失和成员推断损失相结合,用于从神经网络中删除敏感信息的机器遗忘机制,本研究通过成员推断机制作为概念验证,提供了实验证据,证明了我们的遗忘方法在遗忘效果、延迟和主要任务准确性方面的优越性。
Jul, 2024
我们的研究通过利用预训练的大型语言模型(LLMs)、数据增强和新的标签平滑损失函数,在中间注释的视频中,专注于 Gloss2Text 翻译阶段,并在 PHOENIX Weather 2014T 数据集上的广泛实验和消融研究中取得了显著的性能提升,为手语翻译领域的研究和发展提供了有效的方法和有前景的方向。
Jul, 2024
利用视触知觉感知和深度学习的方法来进行机器人操作,其中结合了视触反馈,通过学习神经网络模型进行物体状态估计和未来状态预测。通过使用真实世界的数据进行训练,该模型可以在在线适应中进行触觉信息驱动的预测,具有较强的有效性。
Jul, 2024
针对低精度计算的 Open Compute Project MX 标准,本文描述并评估了首个开源 FPGA 实现的算术计算。我们的设计完全支持标准中定义的具体格式以及标准规定的算术运算,同时还支持任意固定点和浮点格式。通过实现例子神经网络如 ResNet-18,我们展示了 MX 对于 INT5 或 FP6 等格式的非原生支持在 FPGA 上具有非常好的效果,这使得 FPGA 在灵活性和占用更小面积方面占据优势。
Jul, 2024
该研究论文介绍了一种扩展的阻尼块牛顿法,用于解决神经网络中包含质量矩阵的线性方程组,以及求解非线性参数的方法,该方法在计算代价上具有较高效性,并且优于 BFGS 算法。
Jul, 2024
我们探讨基于潜在目标的数据点选择在实际情境中普遍存在,这一选择过程常常扭曲统计分析。然而,我们认为该选择不仅仅是一种偏差,而是提供了深入了解隐藏生成过程的机会。因此,我们研究了选择在顺序数据中的因果结构,并证明了其可识别性,同时提出了一种算法来检测和识别选择结构以及其他类型的依赖关系。
Jun, 2024
通过结合飞机引擎领域和神经网络领域的领域知识,我们提出了一种策略,能够实时预测引擎性能参数,并且在预测准确性、计算效率、建模复杂性和数据依赖性之间取得理想平衡。我们通过精心设计网络结构、调节内部信息流,并采用四种不同的特征融合方法和创新的损失函数公式来实现这一目标。通过对两个不同数据集的全面验证,实验证明了我们的策略的有效性和健壮性,并且相较于传统的黑盒机器学习方法,我们的模型具有更好的解释性。
Jun, 2024
通过神经网络传播输入不确定性时,我们提出了一种同时能够估计输入、数据和模型不确定性的方法,结果表明这种输入不确定性的传播导致更稳定的决策边界,即使在大量输入噪声的情况下也是如此。
Jun, 2024
自动语音识别(ASR)是计算语言学的一个关键领域,主要研究开发能够使计算机将口语转换为文本的技术。该研究聚焦于开发基于 JavaScript 和 Node.js 的网络应用程序和语音识别的网络界面,使用监督学习训练改善语音识别的神经网络,并设计对声音信号进行准确对齐的新型反向传播方法。
Jun, 2024
本研究提出了一种基于两阶段的公式化 α 因子生成框架 AlphaForge,用于 α 因子挖掘和因子组合。该框架利用生成性 - 预测性神经网络生成因子,并结合因子的时间性能进行选择和动态调整权重,实现了在量化投资领域中超越现有基准的效果。
Jun, 2024