Jan, 2025
SELMA:一种用于虚拟助理交互的语音启用语言模型
SELMA: A Speech-Enabled Language Model for Virtual Assistant
Interactions
TL;DR本研究提出并评估了SELMA,一个用于虚拟助理交互的语音启用语言模型,该模型将音频和文本作为输入,旨在同时处理与虚拟助理交互相关的多个任务。通过使用低秩适应模块和特征池策略,SELMA大幅简化了虚拟助理的输入处理流程,并在语音触发和设备导向语音检测等任务上表现出显著的性能提升。