一致之音:基于再利用模型的旅行语音助手设计
本文基于特定领域数据,对沃尔玛的语音购物助手重训练了经过精简的BERT语言模型,并注入了统一的句法依存关系来进一步提高模型性能,最终在四项下游任务中观察到了高达1.31%的平均性能提升。
Mar, 2021
本文介绍了一种基于可预训练的差分可训练模型和使用 Transformer 的层次化系统的语音识别模型,旨在提高其在商用语音助理中的应用性能。实验表明,与基准系统相比,在一些神经网络模型和数据集之上达到了较好的表现。在对数据进行了重新标注并进行了人工评估后,本文提出的方法的语义准确率得到了大幅提高,这显示出本文提出的方法在商用语音助理中的应用价值。
Jun, 2021
本文提出了一种两阶段的简短目录筛选-重新排序推荐系统来匹配第三方语音应用程序到未处理的语音请求,并展示了从基线规则系统收集的观察数据如何构建新系统,以及曝光偏差如何产生离线和人类评估之间的差异,最后提出了两种重新标记方法来处理不完整的基础事实,并缓解曝光偏差。我们通过大量离线实验展示了该系统的有效性。此外,我们展示了在线A/B测试结果,显示用户满意度显著提升。
Oct, 2021
本文提出了一种新的查询扩展和实体加权方法,利用实体目录中的实体关系改进查询重构性能,实验发现该方法相比不使用查询扩展和加权的基准模型,特别是在前10个结果中,精度有6%的提高,在使用查询扩展和加权的其他基准模型中,精度有5%以上的提高。
Feb, 2022
讨论语音交互虚拟助手中的建模问题与挑战,提出了信息检索方法和研究可以应用于提高虚拟助手语音识别质量的机会,并简要概述了语音识别中当前的问题和挑战。
Apr, 2023
语音助手面临指导复杂任务的困境,阅读书面指示的方法存在局限性。本研究观察了12位参与者使用先进的语音助手在家烹饪,发现目前的方法导致了九个挑战,包括隐藏整体情况、提供过多信息以及无法传达信息。通过语音转化书面指示为口头交流形式,提出了八种改进方式,并展望了自然语言处理的现代进展如何帮助智能代理有效地指导用户完成复杂任务。
Jun, 2023
通过在服务器端对口语信息领域查询使用各种类型的语言模型(N-gram词语模型、子词神经模型)进行重计算,结合在设备上和服务器端的信号,通过整合各种服务器端语言模型相比仅在设备上执行ASR,证明了在各种实体中心查询子群体中提高了23%-35%的字词错误率(WER)。此外,通过多个从头开始训练的服务器端语言模型的模型融合最有效地结合了每个模型的互补优势,并将领域特定数据所学到的知识集成到VA ASR系统中。
Nov, 2023
本研究解决了现有语音助手在音频与文本建模中信息丢失和复杂性增加的问题。我们提出了一种新的训练方式,使用文本仅模型的响应作为自我监督,有效地消除了对标注响应的需求。研究表明,该蒸馏语音助手(DiVA)在回答问题、分类和翻译等任务中表现出色,并在用户偏好上超越了现有最先进模型,显示出巨大的潜在影响。
Oct, 2024