BriefGPT.xyz
Ask
alpha
关键词
modal alignment
搜索结果 - 3
ECCV
显式引导的信息交互网络用于跨模态点云补全
该研究论文介绍了一种新颖的框架 EGIInet(Explicitly Guided Information Interaction Network),用于视图引导的点云完整性恢复(ViPC)任务,通过利用完成任务的几何特性,该框架有效地结合
→
PDF
3 days ago
跨可转移的语音转文大型语言模型对齐模块
利用大型语言模型(LLMs)和语音基础模型,先进的语音 - 文本双模工作可以实现复杂的任务,如口语翻译(ST)和问题回答(SQA),同时具有更简单的结构。本文利用 Whisper 编码器和预训练的 Yi-6B 的功能,通过经验结果发现,使用
→
PDF
17 days ago
具有强大 ASR 能力的 LMM 的令人尴尬的简单方法
通过对大型语言模型和语音基础编码器进行多种组合的基准测试和研究,本文提出了一种简单而高效的 SLAM-ASR 系统,该系统在 Librispeech 基准测试中表现出色,并且超过了最新的音频通用模型。同时,本文还探讨了基于 LLM 的 AS
→
PDF
5 months ago
Prev
Next