BriefGPT.xyz
Ask
alpha
关键词
audibility
搜索结果 - 1
通过听觉引导的零射频音频字幕生成
音频字幕任务与图像和视频字幕任务在本质上相似,但鲜有关注。我们提出了音频字幕的三个愿景:生成文本的流畅性,生成文本对输入音频的忠实度以及听觉可感知性。我们的方法是零样本方法,不通过学习而是通过推理过程来进行字幕生成,其中涉及的三个网络对应三
→
PDF
10 months ago
Prev
Next