语音助手可以发出可爱的声音吗？走向可爱声学模型

Apr, 2023

语音助手可以发出可爱的声音吗？走向可爱声学模型

Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics

Katie Seaborn, Somang Nam, Julia Keckeis, Tatsuya Itagaki

TL;DR探讨了日本 kawaii 的概念在声音中的应用，通过用户感知研究了年轻和老年日本计算机声音的 kawaii 特性，发现 kawaii 特性与性别、年龄和 VA 特征有关，提出了一个初步的 kawaii vocalics 模型。

Abstract

The Japanese notion of "kawaii" or expressions of cuteness, vulnerability, and/or charm is a global cultural export. Work has explored kawaii-ness as a design feature and factor of user experience in the visual a

kawaii voice assistant gender age perceptions

发现论文，激发创造

文化敏感性与语音助理的未来联想

通过在线共拟研究，探索了在非西方背景下（如日本）共设计语音助手的价值，并强调文化差异对话语、社交互动和对技术的态度的敏感性。提供了针对日本和英语为主的美国背景的设计指南，以及行为辅助技术设计和学术研究中多元文化的机遇。

Mar, 2024

情感社交人形智能系统

本文提出了一种智能虚拟助手，可通过情感语义解释人类语音情感，并且通过声音风格转移和人工生成方法生成特定情感的声波，使得与之互动的人有更好的体验。

Apr, 2023

关于（声音）互动的先验分布向何处去？

研究指出，语音对话技术基础设计不足，导致人机交互表面上难以实现自然对话，有短暂对话、单向语音等问题存在，需要深入研究本质原理和有效的设计方法。

Mar, 2022

面向友好语音代理的日语共情对话语料库研究

介绍了一种新的语音语料库 STUDIES，用于开发一种语音代理程序，可以友好地说话，并通过将 “共情对话” 行为纳入口语对话系统来开发可以更自然地响应用户的声音代理程序。通过将交际者的情感标签和会话上下文嵌入到文本到语音合成中，可以产生与使用代理的情感标签合成的语音相同程度的自然度。

Mar, 2022

孩子们通过与智能音箱互动理解人工智能

这篇研究通过问卷和面试，研究了 6-11 岁苏格兰儿童对以语音为基础的对话助手的了解程度包括工作原理、认知能力、代理能力、数据隐私和合适的口头交互等，发现大多数儿童高估了对话助手的智能程度，不了解数据隐私和安全方面，同时认为对话助手的不礼貌是错误的，研究结果具有教育意义，有助于教育工作者开发合适的材料以解决 AI 素养的紧迫需求。

May, 2023

什么是您所说的有趣？：个性化语音控制虚拟助手的笑话技能

本文提出多种方法来通过个性化来提高语音控制虚拟助手的幽默水平，其中使用了传统的 NLP 技术和自注意网络和多任务学习相结合的方法，并探讨了隐式反馈的标记策略。实验结果表明，这些深度学习方法比其他方法具有更好的幽默表现，并且可以提高用户满意度。

Dec, 2019

公众对人工智能对话代理的理解：一项跨文化分析

中国参与者在社交媒体上将对话代理视为享乐，并认为基于语音和实体化的对话代理更温暖、更有能力，表达了积极的情绪。与此相反，美国参与者对对话代理的功能更为关注，态度矛盾。温暖的感知是两个国家积极情绪的关键驱动因素。针对不同用户喜好和需求，我们讨论了设计上具有情境敏感性和用户为中心的对话代理的实际意义。

Feb, 2024

面向语言学习应用的非母语儿童语音自动识别

研究评估了两个最先进的自动语音识别系统 Wav2Vec2.0 和 Whisper AI 的性能，以开发一个可以支持儿童学习外语的语音机器人，并探究使用 ASR 技术提供对孩子的发音和流利度的洞察力的效用

Jun, 2023

打造具有非洲裔美国人口音的文本转语音系统：指导原则、技术挑战和令人惊讶的评估

AI 机器人和用户界面的表示普遍是白人，无论是面部和肤色特征上，还是合成的声音；本文探讨了在开发一种以美国非洲裔女性的受教育水平高、专业、不带地方口音的英文文字转语音系统时，所面临的对种族的表示所带来的一些意外挑战，研究开始通过针对非洲裔美国的 IT 专业人员的焦点小组讨论和收集指南和挑战，随后讨论了文字转语音系统开发者面临的技术困难，接着描述了两个研究，参与者在这些研究中无法正确地将非洲裔美国人的声音归因于非洲裔美国人的文字转语音系统，但在类似质量的白人文字转语音系统中却能够正确地识别到种族，该研究进一步验证了我们所构建的非洲裔美国人声音的代表性，并表明非洲裔美国人对于非白人的教育水平高、非方言、专业化的声音与非洲裔美国人的关联可能受到非非洲裔美国人的无能或潜在偏见的影响。

Mar, 2024

一种适用于人类和其他生物的人工智能浏览器架构（AIBA）：一种具有语音名称系统的实现，具备两个保证，即唤醒中立性和个人身份信息价值保护

本研究提出一种语音浏览器和服务器结构，旨在解决目前主流系统中缺乏唤醒中性和无法充分利用 PII 数据的问题，进而最大化其价值，并应用于 COVID-19 咳嗽样本的数据采集，或者将其应用于从车辆、大自然的视频图像、可摄入机器人、多模态信号（EEG，EKG...）甚至是与狗和猫等其他种类的交互中。

Mar, 2022