使用深度神经网络（DNN）的听觉和语义同步关系

Dec, 2023

使用深度神经网络（DNN）的听觉和语义同步关系

Relationship between auditory and semantic entrainment using Deep Neural Networks (DNN)

Jay Kejriwal, Štefan Beňuš

TL;DR该研究利用 BERT 和 TRILL 向量等先进技术提取特征，测量两种不同语言对话中回合间的语义和听觉相似性，并发现人们更倾向于在语义特征上同调，此外，语义和听觉语言特征的同调程度呈正相关，该研究的发现有助于实施在人机交互中的同调机制。

Abstract

The tendency of people to engage in similar, matching, or synchronized behaviour when interacting is known as entrainment. Many studies examined linguistic (syntactic and lexical structures) and paralinguistic (pitch, intensity) →

entrainment linguistic entrainment paralinguistic entrainment semantic similarities auditory similarities

发现论文，激发创造

深度神经网络的无监督音频和语义训练模型

应用深度学习框架从文本特征中提取有意义的表示，研究了语义同步在人际交流和人机交互中的评估及其与声学特征之间的关联性。

Dec, 2023

LEEETs-Dial: 末端对话系统中的语言同步

本研究通过使用共享词汇，介绍了一种实现基于 GPT-2 的端到端对话系统中对话对齐的方法，包括训练实例加权、对齐特定损失和附加调节等技术，通过在 MultiWOZ 数据集上比较不同的对齐技术，我们证明这三种方法都比基准产生出更好对齐的结果，并得到了自动化和人工评估指标的确认。

Nov, 2023

不变语音识别中的解缠

本研究探讨了深度神经网络在处理时间依赖性信号方面的表现，结果显示语音模型会丢弃特定说话人的噪声信号，而保留与任务相关的语音和音素信息，并在后续层级中出现更高层次的概念表示，此外还展示了深度学习在不同时刻从输入中提取任务相关特征，以实现不变语音识别的能力。

Mar, 2020

会话系统的词汇磁化

通过提出一个新的数据集和一种测量方法，该论文探讨了当前的回复生成模型如何不充分地解决话语对齐（Lexical Entrainment）这一重要的类人现象，并提出了两个新的任务和两种基线方法来在会话系统中明确地整合话语对齐。

Oct, 2023

语言熟练度与 F0 同步：对意大利、法国和斯洛伐克母语者进行 L2 英语模仿的研究

这项研究探讨了第二语言（L2）英语演讲模仿中 F0 演化的问题，在交替阅读任务（ART）中。结果表明，L2 英语熟练程度与演化之间存在微妙的关系：熟练程度较高的演讲者在音高变化和下降方面通常表现出较少的演化。然而，在一对一的情况下，熟练程度较高的演讲者表现出更强的模仿音高范围的能力，导致进一步的演化。这表明熟练程度在个体和对位级别上对演化产生不同的影响，突出了语言技能和韵律的复杂相互作用。

Apr, 2024

文本和语音嵌入匹配：探索基于迁移学习的语音检索策略

本文研究了预训练的深度学习模型在跨模态（文字到音频）检索中的应用，使用浅层神经网络将提取的嵌入映射到公共维度，并探究优化模型的先前培训方法和损失函数选择的重要性。

Oct, 2022

建模语音变化的神经表征

研究使用自我监督的神经模型从语音中提取声学嵌入，计算非英语母语和英语母语以及挪威方言发音之间的基于单词的差异，并发现使用转换器的神经模型提取的语音表示与人类感知匹配得更好。

Nov, 2020

特征集比较：根据性别和角色进行对照

研究协作游戏对话中的韵律模仿，观察不同特征集的模仿方式，研究男女讲话者在任务导向类型的互动中的性别依赖策略。

May, 2018

人机交互中拟人化感知的实时度量方法研究

研究了人类与机器人面部交互的音响 - 语调协调程度，发现主观和客观对人形化的感知程度与音声 - 语调协调程度呈正相关。

Jan, 2022

自发语码转换中的调整测量

该研究探讨了在代码切换的语境中，对话者之间是否存在与在单一语言语境中相似的协调现象，并发现积极回答了这一问题，这对通用性的协调现象作为一种交流现象以及包容性和交互式语音技术的潜在应用产生重要影响。

Nov, 2023