BriefGPT.xyz
Ask
alpha
关键词
sequence compression
搜索结果 - 3
PRISE:学习时间动作抽象作为一个序列压缩问题
本研究提出了一种新颖的方法,将引发时间动作抽象视为序列压缩问题,结合连续控制领域中连续动作量化和字节对编码(BPE)的输入标记化,提出了名为 PRISE 的方法,通过多任务机器人操作示范,从中发现的高级技能显著提高了多任务模仿学习以及少样本
→
PDF
5 months ago
针对自监督语音模型的一次性序列压缩
本研究提出了一种可以在多种下游任务中调节压缩率的模型压缩方法,该方法可以在保证语音模型性能的前提下,减小计算成本并且不需要通过网格搜索来确定不同任务的压缩率。
PDF
2 years ago
漏斗变压器:通过过滤连续冗余提高语言处理效率
本研究提出了 Funnel-Transformer 模型,利用序列压缩来提升模型效率,在保证单向量序列表征的前提下极大地减少了计算成本。通过在模型构建时重新投资在长度缩短中节省下来的 FLOPs,进一步提高了模型容量。实验表明,Funnel
→
PDF
4 years ago
Prev
Next