Jan, 2025
VoxEval:评估端到端语音语言模型的知识理解能力
VoxEval: Benchmarking the Knowledge Understanding Capabilities of
End-to-End Spoken Language Models
TL;DR本文针对当前端到端语音语言模型在知识理解方面的不足,提出了VoxEval,一个新的基于语音的问答基准,专注于通过语音交互评估模型的知识理解能力。研究发现,现有模型在多样化音频条件下表现出显著的性能限制,为未来改进提供了关键方向。