BriefGPT.xyz
Ask
alpha
关键词
tri-modal translation (tmt)
搜索结果 - 1
TMT: 通过将不同形式阐述视为不同语言的三模式语音、图像和文本之间的翻译
我们提出了一种新颖的 Tri-Modal Translation(TMT)模型,它能够在语音、图像和文本之间进行任意模态的翻译,并通过将语音和图像数据标记为离散标记来统一界面并显著降低计算成本。通过在 TMT 中使用多模态编码器 - 解码器
→
PDF
4 months ago
Prev
Next