MIT 语音命名系统
该研究开发了一种基于众包的对话助手Chorus,它可以与终端用户进行复杂的对话,并以专业的方式招募工作者来帮助决定最佳响应。研究通过对Chorus的应用部署,提出了四个挑战:确定对话结束时间、恶意用户和工作者、按需招募,以及在没有共识的情况下的设置。这些观察结果对基于众包的对话系统和众包系统的部署有启示作用。
Aug, 2017
通过Alexa Prize进行的研究,结合当今自然语言处理、上下文理解、会话管理等方面的技术,旨在解决对话人工智能问题,从而使得社交对话和自由形式对话在广泛的领域和主题上更加自然地进行。
Jan, 2018
本论文介绍 Snips 语音平台的机器学习体系结构,可在典型的物联网设备微处理器上执行口语理解。所嵌入的推理快速准确,具有隐私保护设计,从不收集用户数据。重点关注自动语音识别和自然语言理解,详细说明了我们训练高性能机器学习模型的方法,使其小到足以在小型设备上实时运行。此外,我们还描述了一种数据生成过程,提供足够的高质量训练数据,而不会危及用户隐私。
May, 2018
本文介绍了一种嵌入式的、面向小型物联网应用的Spoken Language Understanding系统,并证明其性能可以与基于云的商业解决方案相媲美。同时,我们还提供了我们实验使用的数据集,旨在促进SLU社区的可重复性和有益性。
Oct, 2018
介绍了 Chorus 和 Evorus 两个系统,利用实时人类计算与人工智能相结合进行顶层设计。其中,Chorus 是人类计算实现的辅助对话系统,而 Evorus 是自动化 Chorus 系统的框架。通过超过 2,200 次的对话,证明了该系统的自动化和实际应用的可行性。同时,探讨了开发和部署中所遇到的来自“代理人”的挑战和那些难以自动化的对话的特殊挑战。
Oct, 2019
本文介绍了一种名为“Spot The Bot”的聊天机器人评估框架,该框架使用“生存分析”作为度量标准,并通过与其他聊天机器人的比较,评估其在模拟人类会话行为方面的能力,以此取代传统基于人工评估的方式。
Oct, 2020
本研究提出一种语音浏览器和服务器结构,旨在解决目前主流系统中缺乏唤醒中性和无法充分利用 PII 数据的问题,进而最大化其价值,并应用于COVID-19咳嗽样本的数据采集,或者将其应用于从车辆、大自然的视频图像、可摄入机器人、多模态信号(EEG,EKG...)甚至是与狗和猫等其他种类的交互中。
Mar, 2022
自动语音识别(ASR)系统是一项关键技术,用于设计各种应用程序,尤其是智能助手,如Alexa。本文着重于低资源语言Flemish的Intent分类任务,通过在语音级别和音素转录级别应用不同的数据增强技术,改进了现有模型的性能。
Dec, 2023
自然人类语言与机器的交互能力已经不仅仅是司空见惯,而且是被期望的。下一步不仅仅是文本界面,而是语音界面;不仅仅与电脑,而是与包括机器人在内的所有机器的交互。本文记录了近期与机器人的口头对话这一快速发展领域的历史,并提出了三项建议:第一是教育,第二是基准测试,第三是在与机器人的口头交互中对语言建模。这三项建议应该成为任何研究人员借鉴和发展的白皮书。
Apr, 2024
提出了 thoughtful things 这种设备,利用轻量级本地语言模型执行操作并解释行为,以解决智能设备使用的复杂性和语音助手的局限性。
May, 2024