语音助手可以发出可爱的声音吗?走向可爱声学模型
通过在线共拟研究,探索了在非西方背景下(如日本)共设计语音助手的价值,并强调文化差异对话语、社交互动和对技术的态度的敏感性。提供了针对日本和英语为主的美国背景的设计指南,以及行为辅助技术设计和学术研究中多元文化的机遇。
Mar, 2024
介绍了一种新的语音语料库 STUDIES,用于开发一种语音代理程序,可以友好地说话,并通过将 “共情对话” 行为纳入口语对话系统来开发可以更自然地响应用户的声音代理程序。通过将交际者的情感标签和会话上下文嵌入到文本到语音合成中,可以产生与使用代理的情感标签合成的语音相同程度的自然度。
Mar, 2022
这篇研究通过问卷和面试,研究了 6-11 岁苏格兰儿童对以语音为基础的对话助手的了解程度包括工作原理、认知能力、代理能力、数据隐私和合适的口头交互等,发现大多数儿童高估了对话助手的智能程度,不了解数据隐私和安全方面,同时认为对话助手的不礼貌是错误的,研究结果具有教育意义,有助于教育工作者开发合适的材料以解决 AI 素养的紧迫需求。
May, 2023
本文提出多种方法来通过个性化来提高语音控制虚拟助手的幽默水平,其中使用了传统的 NLP 技术和自注意网络和多任务学习相结合的方法,并探讨了隐式反馈的标记策略。实验结果表明,这些深度学习方法比其他方法具有更好的幽默表现,并且可以提高用户满意度。
Dec, 2019
中国参与者在社交媒体上将对话代理视为享乐,并认为基于语音和实体化的对话代理更温暖、更有能力,表达了积极的情绪。与此相反,美国参与者对对话代理的功能更为关注,态度矛盾。温暖的感知是两个国家积极情绪的关键驱动因素。针对不同用户喜好和需求,我们讨论了设计上具有情境敏感性和用户为中心的对话代理的实际意义。
Feb, 2024
研究评估了两个最先进的自动语音识别系统 Wav2Vec2.0 和 Whisper AI 的性能,以开发一个可以支持儿童学习外语的语音机器人,并探究使用 ASR 技术提供对孩子的发音和流利度的洞察力的效用
Jun, 2023
AI 机器人和用户界面的表示普遍是白人,无论是面部和肤色特征上,还是合成的声音;本文探讨了在开发一种以美国非洲裔女性的受教育水平高、专业、不带地方口音的英文文字转语音系统时,所面临的对种族的表示所带来的一些意外挑战,研究开始通过针对非洲裔美国的 IT 专业人员的焦点小组讨论和收集指南和挑战,随后讨论了文字转语音系统开发者面临的技术困难,接着描述了两个研究,参与者在这些研究中无法正确地将非洲裔美国人的声音归因于非洲裔美国人的文字转语音系统,但在类似质量的白人文字转语音系统中却能够正确地识别到种族,该研究进一步验证了我们所构建的非洲裔美国人声音的代表性,并表明非洲裔美国人对于非白人的教育水平高、非方言、专业化的声音与非洲裔美国人的关联可能受到非非洲裔美国人的无能或潜在偏见的影响。
Mar, 2024
本研究提出一种语音浏览器和服务器结构,旨在解决目前主流系统中缺乏唤醒中性和无法充分利用 PII 数据的问题,进而最大化其价值,并应用于 COVID-19 咳嗽样本的数据采集,或者将其应用于从车辆、大自然的视频图像、可摄入机器人、多模态信号(EEG,EKG...)甚至是与狗和猫等其他种类的交互中。
Mar, 2022