BriefGPT.xyz
大模型
Ask
alpha
关键词
sequence-to-sequence task
搜索结果 - 4
CoT3DRef: 链状思考数据高效 3D 视觉定位
设计一种可解释的 3D 视觉定位框架,通过预测一系列锚点和最终目标,将 3D 视觉定位问题形式化为序列到序列任务,将指称任务分解为可解释的中间步骤,从而提高性能并极大地提高数据效率。
PDF
9 months ago
ACL
MIR-GAN:用对抗网络提炼用于音视频语音识别的帧层次模态不变表示
本文提出了一种基于对抗网络的方法(MIR-GAN),旨在跨模态学习共享的表征,以减轻后续的多模态融合过程,并在公共基准 LRS3 和 LRS2 上得到了比现有技术更好的表现。
PDF
a year ago
幻灯片、约束、解析、重复:用于文档 AMR 解析的同步滑动窗口
利用滑动窗口和转移依存句法分析技术提出了一种同步滑动窗口方法,用于解决多句文档的序列到序列任务,其具有很高的性能表现,并不损失黄金跨句链接。
PDF
a year ago
ACL
利用预训练生成语言模型的视频对话
本文提出了一种基于 GPT-2 模型的框架,将视频与文本表示结合成连续、有结构的序列,并利用其 fine-tuning 能力来解决视频对话中的挑战,从而在 Audio-Visual Scene-Aware Dialogues 基准测试中取得
→
PDF
4 years ago
Prev
Next