BriefGPT.xyz
Ask
alpha
关键词
alignment mechanism
搜索结果 - 3
ModaVerse: 用 LLMs 高效转换模态
引入了 ModaVerse,一种多模态大型语言模型(MLLM),能够理解和转换图像、视频和音频等不同模态的内容。通过在自然语言层面上进行输入 / 输出对齐,避免了潜在特征对齐的复杂性,简化了现有 MLLM 的多个训练阶段,从而显著降低了数据
→
PDF
6 months ago
跨模态突出片段增强对齐网络:图像 - 文本检索
通过降低非重要图片和文本片段的参与度,提高对重要片段的对齐相似性,本文介绍了一种新的跨模态突出片段增强对齐网络 (CPFEAN),该网络通过减少在对齐过程中无关区域的参与度并相对提高对齐的突出词,从而实现改进的检索准确性。与最先进的方法相比
→
PDF
8 months ago
一种用于端到端语音识别的拼写校正模型
该研究提出了一种新方法以训练拼写纠错模型来纠正注意力机制序列到序列语音识别模型中的错误,从而改进了性能。在 LibriSpeech 数据集上,该模型相对于基线模型的相对改进为 18.6%,相对于使用扩展语言模型重新评分的 n-best 列表
→
PDF
5 years ago
Prev
Next