BriefGPT.xyz
Ask
alpha
关键词
decoding scheme
搜索结果 - 2
仅使用图像进行语音翻译
通过现有的图像字幕系统,将图像与文本相连接,实现语音音频与文本之间的直接映射,从而扩展了视觉语音模型的连接方式。本研究在一个低资源语言 Yorùbá 上,提出了一种 Yorùbá- 英语语音翻译模型,利用预训练组件以实现在低资源环境中的学习
→
PDF
25 days ago
轻量级语义分割的多层特征逐级聚合解码方案
通过多级视觉变换编码器中的多级特征,本文提出了一种新颖的语义分割解码方案,旨在降低计算开销、提高分割准确性,并通过聚合后的语义增强多级特征,从注意力分配的角度保持上下文一致性,大幅降低计算成本。实验结果表明该方案在计算成本上优于现有语义分割
→
PDF
5 months ago
Prev
Next