BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-visual systems
搜索结果 - 2
2024 年多语言环境下的面声关联(FAME)挑战评估计划
面部 - 语音相关的多语言环境问题是 FAME Challenge 2024 探索的主题,利用 Multilingual Audio-Visual (MAV-Celeb) 数据集来进行研究和评估。
PDF
3 months ago
唇读口型理解:利用跨模态知识蒸馏混合感官进行基于单词模型的唇形理解
本文提出了一种从音频语音识别系统向视觉语音识别器转移技术的方法,其目标是在读唇模型训练过程中利用音频数据。
PDF
2 years ago
Prev
Next