BriefGPT.xyz
Ask
alpha
关键词
auto-regressive transformer
搜索结果 - 3
VioLA: 面向语音识别、合成和翻译的统一编解码器语言模型
本研究提出了 VioLA 模型,它是一个单自回归 Transformer 解码器网络,通过多任务学习框架,将涉及语音和文本的各种跨模态任务统一为条件编解码器语言模型任务。该模型通过离线神经编解码器将所有语音话语转换为离散标记,进而将所有任务
→
PDF
a year ago
SPTS v2:单点场景文本检测
本文提出了 SPTS v2 框架,采用单点注释作为代替传统文本检测与识别的昂贵手工注释方法。采用基于自回归 Transformer 的 IAD 对同一预测序列内所有文本实例的中心点进行预测,采用 PRD 进行文本识别。详细实验结果证明该方法
→
PDF
2 years ago
ECCV
PoseGPT:基于量化的三维人体动作生成和预测
提出了一种基于 PoseGPT 的自回归变换器的方法,该方法可以生成人体运动序列,利用离散的潜在空间使 GPT-like 模型集中于长程信号预测,获得了在几个数据集上实现最先进的结果。
PDF
2 years ago
Prev
Next