- 自动舞蹈视频分割以理解舞蹈编排
提出将舞蹈视频自动分割为每个动作的方法,并通过组合视觉和音频特征使用时序卷积网络来估计分割点,研究表明所提出的方法能够高精度地估计分割点,并开发了一个应用来帮助舞者练习编舞。
- 利用机器学习技术进行雪融驱动型水流预测的比较分析
利用深度学习模型中的时序卷积网络(TCN),在喜马拉雅山流域的喜马拉雅区进行雪融驱动的径流建模,结果表明 TCN 模型优于传统机器学习方法,适用于雪融驱动的流量预测及类似水文应用。
- 基于时空序列和关系学习的情感 - 激活估计的多模态融合方法
通过视频和音频的预处理,提取视觉和音频特征,并利用时间卷积网络和 Transformer 编码器结构提高模型的性能和泛化能力,融合预训练的音频和视频模型进行特征提取,实现了较好的 VA 评估性能(简化中文摘要)。
- 多数据融合与深度学习预测船舶到达引航区时间
使用多数据融合和深度学习方法对船舶抵达引航区的到达时间进行预测,通过提取船舶到达轮廓、数据融合和深度学习等方法,取得了良好的预测准确度和优于基准方法的结果。
- MM基于区域相关性的时空深度学习辅助移动流量预测
提出了一种增强型移动流量预测方案,该方案结合了每日移动流量高峰时间的聚类策略和新颖的多时间卷积网络与长短期记忆模型 (multi TCN-LSTM),实验结果显示与最先进技术相比,性能提升达到 28%,证实了该方法的功效和可行性。
- TCNCA: 多段关注的时间卷积网络用于可伸缩的序列处理
TCNCA 是一种具有切分关注力的时间卷积网络,通过用一种特殊的时间卷积网络替换线性递归操作,在减少计算复杂度的同时提供更大的感受野大小和更浅的网络结构。在多个任务中,TCNCA 表现优于 MEGA,并在处理非常长的序列长度时具有可扩展性。
- 基于自适应降噪技术和时域卷积网络的风电场超短期多步风速预测
提出了一种基于数据降噪技术、时序卷积网络(TCN)和门控循环单元(GRU)的新型风速预测模型,通过数据降噪、特征提取和序列预测实现了具有高精度和强稳定性的风速预测,为风电场的运行和管理提供了支持。
- 用时间卷积网络管理无服务器云中的冷启动
该论文提出了一种新的低耦合、高内聚的集成策略以解决无服务器云堆栈基础结构和功能级别的冷启动问题,并提出了一种基于时间卷积网络(TCN)的深度学习方法,用于预测未来 10 至 15 分钟内功能实例的到来,并在实际数据集上进行了基准测试,证明 - FullSubNet+:利用复数谱的通道注意力 FullSubNet 进行说话增强
本文提出了一种扩展的单通道实时语音增强框架 FullSubNet+,采用了轻量级多尺度时间敏感通道注意力 MulCA 模块、全幅值、实部与虚部谱图作为输入以充分利用噪声语音中的相位信息、以及用时序卷积网络块(TCN)替换原先的长短期记忆层的 - ICCV音视频领导者 - 追随者注意力融合的连续情感识别
本文提出一种视听空间时域深度神经网络,其中包括预训练的二维 - CNN 和几个平行 TCNs,同时利用视听信息,通过跨验证来充分利用数据和缓解过度拟合,并使用交界面关注机制来强调视觉模态和利用嘈杂的听觉模态。在测试集中,本文的方法在 val - SeqNet: 基于序列的分层地点识别描述符学习
本文提出一种新型混合系统,使用 SeqNet 生成临时描述符,并结合单图片学习描述符进行选择性控制序列得分汇总,以创建高性能初始匹配假设生成器,进而在挑战性基准数据集上达到超越现有最先进方法的效果。
- 基于表格金融数据的信用风险监控的序列深度学习
本文提出了一种新的信用风险评估方法,采用深度循环卷积神经网络并利用长期历史金融数据序列的新型信用卡交易抽样技术,优于现有的基于树模型的方法,能够实现显著的金融节约和更早的信用风险检测。
- 使用紧密连接的时间卷积网络进行唇语识别
本研究提出了一种名为 DC-TCN 的方法,使用密集连接的时间卷积网络和轻量级的 Squeeze-and-Excitation 注意力机制来进行单词的唇语识别,取得了 88.36%和 43.65%的识别准确率,超越了其他基准方法,成为两个数 - SELD-TCN: 基于时间卷积网络的声音事件定位和检测
自主机器人系统需要考虑声音信息,作者提出了一种基于时间卷积网络的新型结构 (SELD-TCN),可以提高声音事件定位和检测 (SELD) 的效率和性能。
- 基于分层注意力时序卷积网络的医疗时间序列分类:肌强直症诊断案例研究
本文介绍了一种层次化的基于注意力机制的时间卷积神经网络 (HA-TCN),能够从手握时间序列数据中准确诊断肌无力症,并且具有模型可解释性等优点。在分类准确率和 F1 分数方面,我们发现所有深度学习模型的性能都相似,而它们都优于 SVM。此外 - V2CNet:视频翻译机器人操作指令的深度学习框架
该研究提出了一种新的深度学习框架 V2CNet,用于自动将演示视频翻译成可直接用于机器人应用的命令。这个网络具有两个分支,分别用于编码视觉特征、序列化生成命令和学习精细行动。研究结果表明,V2CNet 在大规模数据集上的性能优于最新的其他方 - ICLR序列建模的格子网络
提出了一种新的序列建模架构:活动网络,其是具有特殊结构的时间卷积网络;文章表明,具有特殊稀疏结构的截断循环网络等效于具有一般重量矩阵的活动网络。实验表明,活动网络在词级语言建模和字符级语言建模任务等多个基准上均优于现有技术。
- CVPR使用迭代软边界分配的弱监督动作分割
本文提出了一种新的行为建模框架,包括一种名为 Temporal Convolutional Feature Pyramid Network(TCFPN)的新型时态卷积网络和一种名为 Iterative Soft Boundary Assig - CVPR基于时间卷积的动作提议:ActivityNet 2017 提交
本研究旨在提出一种基于时间卷积网络的新型提议模型以解决时间行为定位中行为提议的低质量问题,并在该领域取得了最先进的性能结果。
- ECCV时序卷积网络:行动分割的统一方法
提出了一种统一的时间卷积网络方法,可以逐层捕捉低、中、高层次时间尺度上的关系,在三个公共操作分割数据集上以视频或传感器数据实现了优越或竞争性能,并且可以在较短时间内训练完成。