BriefGPT.xyz
Sep, 2024
语言模型感知的语音分词
LAST: Language Model Aware Speech Tokenization
HTML
PDF
Arnon Turetzky, Yossi Adi
TL;DR
本研究针对当前语音分词与语言模型之间的匹配问题,提出了一种新的训练方法,利用预训练文本语言模型的目标来优化语音表示的学习过程。实验结果表明,该方法在语音语言建模和语音转文本任务上优于传统基线,并且能够使用单一的预训练语言模型处理语音和文本输入,提供了更高效的解决方案。
Abstract
Speech Tokenization
serves as the foundation of speech
Language Model
(LM), enabling them to perform various tasks such as spoken language modeling,
→