Feb, 2024

动态压缩中的流式序列转导

TL;DRSTAR 是一种基于 Transformer 的模型,用于在流数据上进行高效的序列转换。通过动态分割输入流创建压缩的锚点表示,STAR 在自动语音识别(ASR)中实现几乎无损压缩(12 倍),并优于现有方法。此外,在同时进行语音到文本任务中,STAR 展示出卓越的分割和延迟 - 质量权衡,优化延迟、内存占用和质量。