BriefGPT.xyz
大模型
Ask
alpha
关键词
transcribed speech
搜索结果 - 2
作者归属模型能否识别演讲记录中的讲话者?
论文通过研究转写语音来探讨作者识别的问题,重点在于解决转写语音中特有的挑战性,包括控制主题相关性和基于转写语音构建的 speaker attribution 基准测试。通过与神经网络和非神经网络模型进行对比,发现尽管书面文本的作者识别模型在
→
PDF
8 months ago
ACL
视觉引导的归纳偏置在口语学习中的应用
本文讨论了一种利用多任务学习的方式,在端到端的语言处理中利用已有的转录发音从而带来图像检索表现的一个显著的提高,这是由于转录发音为模型提供了很强的归纳偏置,这些是通过匹配发音字幕、语音和文本、以及文本和图像等三个任务来实现的。
PDF
6 years ago
Prev
Next