BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal fusion technique
搜索结果 - 1
EMNLP
耳语 LLaMA: 语音识别的跨模态生成错误修正框架
我们引入了一种新的跨模态融合技术,用于在自动语音识别(ASR)中进行生成性错误校正。我们的方法利用声学信息和外部语言表示来生成准确的语音转录上下文。与现有的基于排名的重排序方法不同,我们的方法巧妙地使用了不同的初始化技术和参数高效算法,从预
→
PDF
9 months ago
Prev
Next