BriefGPT.xyz
大模型
Ask
alpha
关键词
text tokens
搜索结果 - 3
利用大型语言模型进行端到端语音识别的语境化
通过引入一种新方法,结合大型语言模型(LLMs)来进行上下文化的语音识别模型,我们证明通过添加适配器的少量可训练参数,可以在保持相同的文本输入功能的同时,实现预训练 LLM 的上下文化语音识别能力并显著提高性能。
PDF
9 months ago
AAAI
CLIP-ReID: 充分利用视觉 - 语言模型进行图像重新识别,无需具体文本标签
本文提出了一种利用 CLIP 模型的文本 - 图像交互能力来解决细粒度图像重识别问题的方法,通过对学习的文本编码器给出模糊的文本描述来增强视觉表示,并通过一系列基于对比度损失的优化训练来优化文本令牌。
PDF
2 years ago
CVPR
用于多通道视频 - 语言检索的预训练对比模型的快速适应
探索多模态检索中利用预训练对比模型和文本符号融合信息的最佳方式,并发现用离散文本符号表示视频的方法取得最佳效果。
PDF
2 years ago
Prev
Next