视频中人声检测

MMOct, 2021

Detecting speaking persons in video

PDF

Hannes Fassold

TL;DR本文提出了一种通过利用神经网络提取面部标志，并对这些标志进行时间统计分析以检测视频中的发言者的新方法。

Abstract

We present a novel method for detecting speaking persons in video, by extracting facial landmarks with a →

speaking persons video facial landmarks neural network statistical analysis

发现论文，激发创造

暗影中的曙光：利用成员推断进行机器去学习

通过创造一种新的损失函数，将目标分类损失和成员推断损失相结合，用于从神经网络中删除敏感信息的机器遗忘机制，本研究通过成员推断机制作为概念验证，提供了实验证据，证明了我们的遗忘方法在遗忘效果、延迟和主要任务准确性方面的优越性。

Jul, 2024

Gloss2Text: 使用 LLMs 和语义感知标签平滑的手语标记翻译

我们的研究通过利用预训练的大型语言模型（LLMs）、数据增强和新的标签平滑损失函数，在中间注释的视频中，专注于 Gloss2Text 翻译阶段，并在 PHOENIX Weather 2014T 数据集上的广泛实验和消融研究中取得了显著的性能提升，为手语翻译领域的研究和发展提供了有效的方法和有前景的方向。

Jul, 2024

RoboPack: 学习基于触觉信息的密集装箱动力学模型

利用视触知觉感知和深度学习的方法来进行机器人操作，其中结合了视触反馈，通过学习神经网络模型进行物体状态估计和未来状态预测。通过使用真实世界的数据进行训练，该模型可以在在线适应中进行触觉信息驱动的预测，具有较强的有效性。

Jul, 2024

探索 MX 及其进一步的 FPGA 设计

针对低精度计算的 Open Compute Project MX 标准，本文描述并评估了首个开源 FPGA 实现的算术计算。我们的设计完全支持标准中定义的具体格式以及标准规定的算术运算，同时还支持任意固定点和浮点格式。通过实现例子神经网络如 ResNet-18，我们展示了 MX 对于 INT5 或 FP6 等格式的非原生支持在 FPGA 上具有非常好的效果，这使得 FPGA 在灵活性和占用更小面积方面占据优势。

Jul, 2024

神经网络方法的快速迭代求解器：II. 1D 扩散 - 反应问题与数据拟合

该研究论文介绍了一种扩展的阻尼块牛顿法，用于解决神经网络中包含质量矩阵的线性方程组，以及求解非线性参数的方法，该方法在计算代价上具有较高效性，并且优于 BFGS 算法。

Jul, 2024

检测和识别连续数据中的选择结构

我们探讨基于潜在目标的数据点选择在实际情境中普遍存在，这一选择过程常常扭曲统计分析。然而，我们认为该选择不仅仅是一种偏差，而是提供了深入了解隐藏生成过程的机会。因此，我们研究了选择在顺序数据中的因果结构，并证明了其可识别性，同时提出了一种算法来检测和识别选择结构以及其他类型的依赖关系。

Jun, 2024

使用物理内嵌数据驱动方法预测航空发动机性能

通过结合飞机引擎领域和神经网络领域的领域知识，我们提出了一种策略，能够实时预测引擎性能参数，并且在预测准确性、计算效率、建模复杂性和数据依赖性之间取得理想平衡。我们通过精心设计网络结构、调节内部信息流，并采用四种不同的特征融合方法和创新的损失函数公式来实现这一目标。通过对两个不同数据集的全面验证，实验证明了我们的策略的有效性和健壮性，并且相较于传统的黑盒机器学习方法，我们的模型具有更好的解释性。

Jun, 2024

统一不确定性：将输入、数据和模型不确定性合并为单个公式

通过神经网络传播输入不确定性时，我们提出了一种同时能够估计输入、数据和模型不确定性的方法，结果表明这种输入不确定性的传播导致更稳定的决策边界，即使在大量输入噪声的情况下也是如此。

Jun, 2024

自动语音识别系统 —— 印地语

自动语音识别（ASR）是计算语言学的一个关键领域，主要研究开发能够使计算机将口语转换为文本的技术。该研究聚焦于开发基于 JavaScript 和 Node.js 的网络应用程序和语音识别的网络界面，使用监督学习训练改善语音识别的神经网络，并设计对声音信号进行准确对齐的新型反向传播方法。

Jun, 2024

AlphaForge：一个挖掘和动态组合公式化 Alpha 因子的框架

本研究提出了一种基于两阶段的公式化 α 因子生成框架 AlphaForge，用于 α 因子挖掘和因子组合。该框架利用生成性 - 预测性神经网络生成因子，并结合因子的时间性能进行选择和动态调整权重，实现了在量化投资领域中超越现有基准的效果。

Jun, 2024