Jun, 2023
AudioPaLM:一种可以说话和听取的大型语言模型
AudioPaLM: A Large Language Model That Can Speak and Listen
Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, Ankur Bapna, Zalán Borsos...
TL;DRAudioPaLM 结合了 PaLM-2 和 AudioLM 两种语言模型,实现了对文本和语音的处理和生成,在语音识别和语音翻译等应用中具有优异性能,并且具有零 - shot 语音到文字翻译的能力。