MIT 语音命名系统

Mar, 2022

The MIT Voice Name System

Brian Subirana, Harry Levinson, Ferran Hueto, Prithvi Rajasekaran, Alexander Gaidis...

TL;DR本文介绍了MIT Voice Name System（VNS）和Huey，VNS是一种类似于DNS的系统，用于保留和使用唤醒词来激活人工智能设备，并且提出了Huey，一种无歧义的自然语言与AI设备交互的方法，旨在使语音交互能够达到类似于电话号码系统或Internet DNS的全球性普及。

Abstract

This RFC white Paper summarizes our progress on the mit voice name system (vns) and Huey. The vns, similar in name and function to the DNS

发现论文，激发创造

部署即时众包对话代理的挑战：“我还能帮您做什么？

该研究开发了一种基于众包的对话助手Chorus，它可以与终端用户进行复杂的对话，并以专业的方式招募工作者来帮助决定最佳响应。研究通过对Chorus的应用部署，提出了四个挑战：确定对话结束时间、恶意用户和工作者、按需招募，以及在没有共识的情况下的设置。这些观察结果对基于众包的对话系统和众包系统的部署有启示作用。

Aug, 2017

对话人工智能：Alexa Prize背后的科学

通过Alexa Prize进行的研究，结合当今自然语言处理、上下文理解、会话管理等方面的技术，旨在解决对话人工智能问题，从而使得社交对话和自由形式对话在广泛的领域和主题上更加自然地进行。

Jan, 2018

Snips Voice Platform: 面向私有设计的嵌入式语音理解系统，用于语音接口

本论文介绍 Snips 语音平台的机器学习体系结构，可在典型的物联网设备微处理器上执行口语理解。所嵌入的推理快速准确，具有隐私保护设计，从不收集用户数据。重点关注自动语音识别和自然语言理解，详细说明了我们训练高性能机器学习模型的方法，使其小到足以在小型设备上实时运行。此外，我们还描述了一种数据生成过程，提供足够的高质量训练数据，而不会危及用户隐私。

May, 2018

边缘上的口语理解

本文介绍了一种嵌入式的、面向小型物联网应用的Spoken Language Understanding系统，并证明其性能可以与基于云的商业解决方案相媲美。同时，我们还提供了我们实验使用的数据集，旨在促进SLU社区的可重复性和有益性。

Oct, 2018

自动化对话

介绍了 Chorus 和 Evorus 两个系统，利用实时人类计算与人工智能相结合进行顶层设计。其中，Chorus 是人类计算实现的辅助对话系统，而 Evorus 是自动化 Chorus 系统的框架。通过超过 2,200 次的对话，证明了该系统的自动化和实际应用的可行性。同时，探讨了开发和部署中所遇到的来自“代理人”的挑战和那些难以自动化的对话的特殊挑战。

Oct, 2019

Spot The Bot: 评估对话式系统的强大高效框架

本文介绍了一种名为“Spot The Bot”的聊天机器人评估框架，该框架使用“生存分析”作为度量标准，并通过与其他聊天机器人的比较，评估其在模拟人类会话行为方面的能力，以此取代传统基于人工评估的方式。

Oct, 2020

一种适用于人类和其他生物的人工智能浏览器架构（AIBA）：一种具有语音名称系统的实现，具备两个保证，即唤醒中立性和个人身份信息价值保护

本研究提出一种语音浏览器和服务器结构，旨在解决目前主流系统中缺乏唤醒中性和无法充分利用 PII 数据的问题，进而最大化其价值，并应用于COVID-19咳嗽样本的数据采集，或者将其应用于从车辆、大自然的视频图像、可摄入机器人、多模态信号（EEG，EKG...）甚至是与狗和猫等其他种类的交互中。

Mar, 2022

在超低资源环境下创建口语对话系统

自动语音识别（ASR）系统是一项关键技术，用于设计各种应用程序，尤其是智能助手，如Alexa。本文着重于低资源语言Flemish的Intent分类任务，通过在语音级别和音素转录级别应用不同的数据增强技术，改进了现有模型的性能。

Dec, 2023

与机器人对话：拓宽参与和研究的SLIVAR社区提案

自然人类语言与机器的交互能力已经不仅仅是司空见惯，而且是被期望的。下一步不仅仅是文本界面，而是语音界面；不仅仅与电脑，而是与包括机器人在内的所有机器的交互。本文记录了近期与机器人的口头对话这一快速发展领域的历史，并提出了三项建议：第一是教育，第二是基准测试，第三是在与机器人的口头交互中对语言建模。这三项建议应该成为任何研究人员借鉴和发展的白皮书。

Apr, 2024

周到之物：用小型语言模型构建以人为本的智能设备

提出了 thoughtful things 这种设备，利用轻量级本地语言模型执行操作并解释行为，以解决智能设备使用的复杂性和语音助手的局限性。

May, 2024