BriefGPT.xyz
Ask
alpha
关键词
multi-modality alignment
搜索结果 - 3
ACL
OpenSR: 通过维护多模态对齐实现开放式语音识别
本研究提出 OpenSR,通过维护来自高资源领域的未标记多媒体话语中音位空间中的多模态对齐,实现零样例模态转换,进而实现应用于不同模态的模型训练并采用基于聚类的提示调整策略来处理新域话语中的领域移位,结果表明 OpenSR 在三种不同设置下
→
PDF
a year ago
通过叙述学习将说明文章与视频联系起来
本文提出了一种无需手动监督的方法来将『如何做』视频中的步骤与 wikiHow 等语言知识库中的指导文章进行对齐,并采用多模态对齐进行全局时间定位,验证结果表明与现有方法相比具有明显优势。
PDF
a year ago
高帧率跟踪的帧 - 事件对齐与融合网络
该论文提出了使用多模方式结合 RGB-based trackers 和 event-based cameras 进行 high frame rate tracking 的方法,并应用 multi-modality alignment 和 f
→
PDF
a year ago
Prev
Next